IK Analyzer GitHub地址https://github.com/medcl/elasticsearch-analysis-ik
dockerfile安装方式:http://www.manongjc.com/detail/6-bhcldluizxnbloh.html
有关dockerfile学习资料:
https://www.cnblogs.com/edisonchou/p/dockerfile_inside_introduction.html
FROM docker.elastic.co/elasticsearch/elasticsearch:6.5.4
RUN elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.5.4/elasticsearch-analysis-ik-6.5.4.zip
或者:
FROM docker.elastic.co/elasticsearch/elasticsearch:7.1.1
ADD elasticsearch-analysis-ik-7.1.1 /usr/share/elasticsearch/plugins/elasticsearch-analysis-ik-7.1.1
从文件夹安装方式:
1.下载与安装:
(1)从GitHub下载与elasticsearch版本对应的ik版本,地址https://github.com/medcl/elasticsearch-analysis-ik/releases
(2)将下载的zip解压后,放到es目录下的plugins目录中。
(3)重启es,ik生效
2.测试分词效果:
ik分词器有ik_smart 和 ik_max_word 两种分词策略。此处在kibana内测试分词效果。
#使用默认分词器(逐字拆开):
GET _analyze
{
“text”: “上海交通大学”
}
#使用ik_smart分词(粗粒度):
GET _analyze
{
“analyzer”: “ik_smart”,
“text”: “上海交通大学”
}
#使用ik_max_word(细粒度):
3.自定义扩展词词典:
在elasticsearch/plugins/elasticsearch-analysis-ik-x.x.x(第一步中解压后添加的目录)/config目录下,找到IKAnalyzer.cfg.xml文件。
将所需要的自定义词语添加到新创建的词典new_dic.dic文件中,并将该dic文件放到config目录下。可以新建一个新的目录以便管理。
对IKAnalyzer.cfg.xml文件进行修改。可以通过添加此处填写自定义词典文件的地址条目,添加词典。类似的,可以在下面添加停用词词典等。
重启es。可以看到,自定义的词典在启动时被加载。
测试加入自定义词典后的分词效果:
GET _analyze
{
“analyzer”: “ik_smart”,
“text”: “上海交通大学”
}
默认词典: