【ES-04】CentOS7.6安装IK6.2.2分词器插件

1、环境同上篇文章

2、使用ElasticSearch-plugin安装

IK github网站

cd kibana-6.2.2
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.0/elasticsearch-analysis-ik-6.2.0.zip

3、查看安装目录

ll plugins/analysis-ik/

# 显示如下内容
total 1420
-rw-r--r--. 1 root root 263965 May 13 09:21 commons-codec-1.9.jar
-rw-r--r--. 1 root root  61829 May 13 09:21 commons-logging-1.2.jar
-rw-r--r--. 1 root root  52572 May 13 09:21 elasticsearch-analysis-ik-6.2.2.jar
-rw-r--r--. 1 root root 736658 May 13 09:21 httpclient-4.5.2.jar
-rw-r--r--. 1 root root 326724 May 13 09:21 httpcore-4.4.4.jar
-rw-r--r--. 1 root root   1805 May 13 09:21 plugin-descriptor.properties

4、测试

image.png

5、自定义词典

cd config/analysis-ik
mkdir custom
vi custom/new_word.dic
# 添加“学习强国”
cat custom/new_word.dic
学习强国

6、更新配置

vim IKAnalyzer.cfg.xml

image.png

4、重启elasticsearch,测试

 

image.png

ik 带有两个分词器
ik_max_word :会将文本做最细粒度的拆分;尽可能多的拆分出词语 
ik_smart:会做最粗粒度的拆分;已被分出的词语将不会再次被其它词语占有

ik_max_word,这种分词会把词句分为最小和各种组合: 
举例:我想去少年宫 
分词是: 我,想,去,少,年,宫 
用户查找的时候,输入任何一个包含的词句都会查找的到记录,

使用ik_smart: 会分词:想去,少年宫

用户输入 少年,会查不到记录。


作者:境与界
链接:https://www.jianshu.com/p/0b6627ed70df
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值