注意:分词器版本和ES版本要保持一致
1.下载分词器放到ES目录下
2.解压分词器到plugin目录下
unzip elasticsearch-analysis-ik-7.7.0.zip -d plugins/elasticsearch-analysis-ik-7.7.0
3.重启ES自动加载IK分词器
# 中文分词器,IK分词器
GET /_analyze
{
"text":"中华人民共和国国徽",
"analyzer":"ik_smart"
}
下图结果标识IK分词器成功
4.配置自定义的分词器规则
查看IK默认配置
5.创建自己的拓展分词规则
拓展自己的字典
修改前效果
修改后效果(ES需要重启)
5.IK支持的分词模式
ik_max_word:做最细粒度的拆分
将“中华人民共和国人民大会堂”拆分为“中华人民共和国、中华人民、中华、华人、人民共和国、人民、共和国等词语
ik_smart:做最粗粒度的拆分
将“中华人民共和国”拆分为中华人民共和国。
6.热更新 IK 分词使用方法
7.增加远程词根文件(UTF-8)
8.增加nginx配置访问词根文件
location /es/remote_ext_dict.txt {
alias /home/系统业务/ES热词/remote_ext_dict.txt;
}
location /es/remote_ext_stopwords.txt {
alias /home/系统业务/ES热词/remote_ext_stopwords.txt;
}
修改IK配置文件并重启