ElasticSearch7.2学习—ik分词器使用

IK分词器

IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包,功能很强大。其实ElasticSearch本带有分词器,对英文的支持非常好,对中文分词不是很好。当然还有其他的分词器比如HanLp

下载IK分词器插件

https://github.com/medcl/elasticsearch-analysis-ik(注意:下载的版本需要与ElasticSearch对应,ElasticSearch是7.2的,analysis-ik也必须是7)
下载压缩包后,可以根据官网的配置方法,大部分博客都是根据官网的方法来配置的,需要maven编译

ElasticSearch配置ik分词器

编译后把target/release目录下的elasticsearch-analysis-ik-1.3.0.zip上传到/usr/local/elasticsearch-1.4.4/plugins/analysis-ik目录下然后使用unzip解压。

把下载的ik插件中config目录下的文件拷贝到/usr/local/elasticsearch-1.4.4/config目录下,这些文件时ik的配置文件,custom是自定义词库文件。

重启es

有的博客提到修改elasticsearch.yml文件,把ik分词器设置为es的默认分词器。我添加这句配置后报错,不知道什么原因,可能是7.2的不支持这种配置了

index.analysis.analyzer.default.type:ik

自定义分词器

1:创建一个dic文件,编码格式必须为utf-8无BOM格式,每个词一行多个词需要换行。
在这里插入图片描述
2:将自定义的dic文件上传到/usr/local/elasticsearch-1.4.4/config/custom目录下
3:修改ik的配置文件/usr/local/elasticsearch-1.4.4/config/IKAnalyzer.cfg.xml,在其中指定自定义的dic文件。
在这里插入图片描述

4:重启es

原文:https://blog.csdn.net/ty4315/article/details/52475474

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值