The IK Analysis plugin integrates Lucene IK analyzer into elasticsearch, support customized dictionary.
IK分词器是一个中文分词器插件,支持用户自定义词典;
(1)安装
GitHub下载链接:https://github.com/medcl/elasticsearch-analysis-ik
注意下载的 IK 版本 与 ES 版本 相对应,点击右边的 Releases 进入版本选择页面;
下载第一个 zip 包;
在 ES 安装目录的 plugins 目录下创建 ik 文件夹,将 zip 解压后的文件转移进去;
重启 elasticsearch.bat,成功加载 ik 插件;
注意:
如果遇到这样的报错, 是因为路径中带有空格!记得 ES 路径中千万不要带空格!
(2)测试
IK 分词器提供2中分词模式,ik_smart 和 ik_max_word;
其中 ik_smart 为最粗粒度切分,ik_max_word 为最细粒度切分;
- 测试 ik_smart 模式:
- 测试 ik_max_word 模式:
(3)自定义用户字典
修改 ik 目录中 config 文件夹下的 IKAnalyzer.cfg.xml 文件;
在 ext.dic 文件中添加扩展词库,在 stopword.dic 文件中添加停用词;两文件均在当前目录下,与 IKAnalyzer.cfg.xml 在同一文件夹;