系统:Cent OS 7
Elasticsearch版本 : 7.6.2
Kibana版本:7.6.2
IK Analysis版本:7.x
git地址:https://github.com/medcl/elasticsearch-analysis-ik/tree/master
ik analyzer需要和es版本对应,当前master对应es 7.x版本,直接下载最新的就行。
下载完成后进入到es的plugins中,新建一个ik文件夹,把下载的压缩包上传到该文件夹下,解压
切换用户,启动es会看到ik分词器被加载了
打开kibana测试分词
ik_smart为最少切分
ik_max_word为最细粒度划分
假如拆一个人名:张万福,可以看到分词器把名字拆成了2部分,如果想当做一个整体不被拆分这时候就需要自定义字典
自定义分词器
进入到es插建plugin的ik文件夹中,.dic结尾的就是已存在的字典,我们需要创建一个.dic文件,里面一个词语单独一行
vim people_name.dic
保存后需要在IKAnalyzer.cfg.xml中添加创建的字典
Ik是国人的项目,所以提示信息都很友好(说白了英文烂 0.0 ),多个自定义字典用英文分号“;”隔开。
保存后重启es可以看到自定义字典被加载了
再次尝试张万福就没有被拆分了