一. 什么是分词器
因为Elasticsearch中默认的标准分词器分词器对中文分词不是很友好,会将中文词语拆分成一个一个中文的汉子。因此引入中文分词器-es-ik插件。
二. 演示传统分词器
三. IK分词器安装及演示
3.1 下载地址
https://github.com/medcl/elasticsearch-analysis-ik/releases
3.2 特别注意
注意: es-ik分词插件版本一定要和es安装的版本对应,不然会报错,本人亲测!!!
3.3 安装步骤
第一步:下载es的IK插件命名改为ik插件
第二步: 上传到/usr/local/elk/elasticsearch-6.7.0/plugins/
第三步: 重启elasticsearch即可
目录截图:
3.4 演示效果
四. 自定义扩展字典
4.1 新建字典与配置
- cd /usr/local/elk/elasticsearch-6.7.0/plugins/ik/config/custom
- vim custom/new_word.dic
- 新增流行词:
老铁
王者荣耀
洪荒之力
共有产权房
一带一路
何金荣
好嗨哟
好巴适 - vim IKAnalyzer.cfg.xml