李林超博客
首页
归档
留言
友链
动态
关于
归档
留言
友链
动态
关于
首页
Java
正文
ElasticSearch安装IK分词器
Leefs
2021-02-10 PM
1850℃
0条
# 07.ElasticSearch安装IK分词器 ### 一、分词器介绍 之前我们创建索引,查询数据,都是使用的默认的分词器,分词效果不太理想,会把text的字段分成一个一个汉字,然后搜索的时候也会把搜索的句子进行分词,所以这里就需要更加智能的分词器IK分词器了。 ### 二、IK分词器安装 **1、下载地址** https://github.com/medcl/elasticsearch-analysis-ik/releases?after=v7.6.1 因为,这里你需要根据你的Es的版本来下载对应版本的IK,这里我使用的是7.6.1的ES,所以就下载ik-7.6.1.zip的文件。 ![07.ElasticSearch安装IK分词器01.png](https://lilinchao.com/usr/uploads/2021/02/1887519226.png) **2、解压** 将下载好的IK分词器解压到ES的/plugin/ik目录下。 ![07.ElasticSearch安装IK分词器02.jpg](https://lilinchao.com/usr/uploads/2021/02/3601821477.jpg) 到这里已经完成了,不需要去elasticSearch的 elasticsearch.yml 文件去配置。 **3、重启观察ES** 可以看到ik分词器被加载了! ![07.ElasticSearch安装IK分词器03.jpg](https://lilinchao.com/usr/uploads/2021/02/490042346.jpg) **4、查看ES安装插件** elasticsearch-plugin 可以通过这个命令来查看加载进来的插件 ![07.ElasticSearch安装IK分词器04.jpg](https://lilinchao.com/usr/uploads/2021/02/1169972869.jpg) **5、使用kibana测试** + ik_smart:最少切分 ```json GET _analyze { "analyzer": "ik_smart", "text":"李林超博客" } ``` + ik_max_word:最细粒度划分 ```json GET _analyze { "analyzer": "ik_max_word", "text":"李林超博客" } ``` **查看输出结果** ```json { "tokens" : [ { "token" : "李", "start_offset" : 0, "end_offset" : 1, "type" : "CN_CHAR", "position" : 0 }, { "token" : "林", "start_offset" : 1, "end_offset" : 2, "type" : "CN_CHAR", "position" : 1 }, { "token" : "超", "start_offset" : 2, "end_offset" : 3, "type" : "CN_CHAR", "position" : 2 }, { "token" : "博客", "start_offset" : 3, "end_offset" : 5, "type" : "CN_WORD", "position" : 3 } ] } ``` 但是,我们发现“李林超”并没有按照我们想象的被当做一个词。 如果发现分词器中没有而分词器中没有的词,我们需要手动加入到分词器中。 ### 三、IK分词器增加配置 1、IK分词器的config目录下创建llc.dic文件 ![07.ElasticSearch安装IK分词器05.jpg](https://lilinchao.com/usr/uploads/2021/02/1879912099.jpg) 2、在llc.dic文件中添加词组【李林超】、【李林超博客】 ![07.ElasticSearch安装IK分词器06.jpg](https://lilinchao.com/usr/uploads/2021/02/3405097817.jpg) 3、在`IKAnalyzer.cfg.xml`文件下引入llc.dic文件 ![07.ElasticSearch安装IK分词器07.jpg](https://lilinchao.com/usr/uploads/2021/02/112067266.jpg) 4、重启ES ![07.ElasticSearch安装IK分词器08.jpg](https://lilinchao.com/usr/uploads/2021/02/1679583693.jpg) 我们发现llc.dic文件被加载进来了。
标签:
Elasticsearch
非特殊说明,本博所有文章均为博主原创。
如若转载,请注明出处:
https://lilinchao.com/archives/1036.html
上一篇
ElasticSearch分析和分析器
下一篇
ElasticSearch核心概念
评论已关闭
栏目分类
随笔
2
Java
326
大数据
229
工具
31
其它
25
GO
47
NLP
4
标签云
Tomcat
Yarn
Shiro
MyBatis-Plus
VUE
Eclipse
国产数据库改造
ClickHouse
Azkaban
SQL练习题
Java工具类
Typora
散列
并发线程
哈希表
设计模式
序列化和反序列化
Kafka
Jquery
算法
容器深入研究
JavaWEB项目搭建
nginx
Golang
Hbase
Flink
Filter
JavaSE
Livy
JavaScript
友情链接
申请
范明明
庄严博客
Mx
陶小桃Blog
虫洞
评论已关闭