es ik

IK Analyzer GitHub地址https://github.com/medcl/elasticsearch-analysis-ik

dockerfile安装方式:http://www.manongjc.com/detail/6-bhcldluizxnbloh.html
有关dockerfile学习资料:
https://www.cnblogs.com/edisonchou/p/dockerfile_inside_introduction.html

FROM docker.elastic.co/elasticsearch/elasticsearch:6.5.4
RUN elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.5.4/elasticsearch-analysis-ik-6.5.4.zip 

或者:

FROM docker.elastic.co/elasticsearch/elasticsearch:7.1.1
ADD elasticsearch-analysis-ik-7.1.1 /usr/share/elasticsearch/plugins/elasticsearch-analysis-ik-7.1.1

从文件夹安装方式:
1.下载与安装:
(1)从GitHub下载与elasticsearch版本对应的ik版本,地址https://github.com/medcl/elasticsearch-analysis-ik/releases
在这里插入图片描述
(2)将下载的zip解压后,放到es目录下的plugins目录中。
在这里插入图片描述
(3)重启es,ik生效
在这里插入图片描述
2.测试分词效果:
ik分词器有ik_smart 和 ik_max_word 两种分词策略。此处在kibana内测试分词效果。

#使用默认分词器(逐字拆开):
GET _analyze
{
“text”: “上海交通大学”
}
在这里插入图片描述

#使用ik_smart分词(粗粒度):
GET _analyze
{
“analyzer”: “ik_smart”,
“text”: “上海交通大学”
}
在这里插入图片描述

#使用ik_max_word(细粒度):
在这里插入图片描述

3.自定义扩展词词典:
在elasticsearch/plugins/elasticsearch-analysis-ik-x.x.x(第一步中解压后添加的目录)/config目录下,找到IKAnalyzer.cfg.xml文件。
在这里插入图片描述
将所需要的自定义词语添加到新创建的词典new_dic.dic文件中,并将该dic文件放到config目录下。可以新建一个新的目录以便管理。
在这里插入图片描述
在这里插入图片描述
对IKAnalyzer.cfg.xml文件进行修改。可以通过添加此处填写自定义词典文件的地址条目,添加词典。类似的,可以在下面添加停用词词典等。
在这里插入图片描述
重启es。可以看到,自定义的词典在启动时被加载。
在这里插入图片描述
测试加入自定义词典后的分词效果:
GET _analyze
{
“analyzer”: “ik_smart”,
“text”: “上海交通大学”
}
在这里插入图片描述
默认词典:在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Elasticsearch是一种开源的分布式搜索和分析引擎,IK是一种为Elasticsearch提供中文分词功能的插件。 在Elasticsearch中,IK库热更新是指在运行时更新IK分词库,使其能够实时反映最新的词库变化。 在传统的Elasticsearch配置中,需要重启Elasticsearch节点才能使新的分词库生效。这意味着每次有新的词库更新,都需要停止节点,更新配置,然后重新启动节点。这种方式不仅繁琐,还会导致服务的停机时间增加。 为了解决这个问题,IK库引入了热更新机制。通过热更新,可以在不重启节点的情况下更新分词库。具体的步骤如下: 1. 准备新的分词库文件。可以从IK库的GitHub仓库或其他可信的来源获取最新版的分词库文件。 2. 将新的分词库文件放入对应的目录中。通常,IK库的分词库文件存放在elasticsearch/plugins/ik/config目录下。 3. 发送热更新请求。使用Elasticsearch的API向节点发送热更新请求,指定要更新的分词库名称和新的分词库文件目录。 4. 节点接收到热更新请求后,会在后台加载新的分词库文件。一旦加载完成,新的分词库就会生效。 5. 使用最新的分词库。现在,Elasticsearch节点已经更新了IK分词库,可以在搜索和分析中使用最新的分词功能。 通过热更新机制,Elasticsearch IK库可以实现实时更新中文分词库,无需重启节点。这使得系统维护更加方便快捷,并且可以保证搜索和分析的准确性和效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值