中文分词器插件ik

一、分词器

因为Elasticsearch中默认的标准分词器对中文分词不是很友好,会将中文词语拆分成一个一个中文的汉字。因此引入中文分词器-es-ik插件。

传统分词器演示效果: 会将词语拆分成一个一个汉字
在这里插入图片描述

二、安装中文分词器

1、下载对应插件
https://github.com/medcl/elasticsearch-analysis-ik/releases
注:插件一定要下载和es相对应的版本

这个插件里面用到HttpClient 因为要远程获取关键词 拉取网上的热词 还有es通信
在这里插入图片描述
2、上传到/usr/local/elasticsearch-6.4.3/plugins

3、解压之后重命名为ik

4、 重启elasticsearch即可

使用postman测试:出现了分词效果
在这里插入图片描述

三、自定义热词、拓展词

1、在/usr/local/elasticsearch-6.4.3/plugins/ik/config目录下新建customer文件夹
mkdir customer
2、在customer文件夹下新建文件
vi new_word.dic

老铁
王者荣耀
洪荒之力
共有产权房
一带一路

3、保存文件,配置IKAnalyzer.cfg.xml(在config目录下)文件
在这里插入图片描述
4、启动es
发现我们配置的王者荣耀起到了效果
在这里插入图片描述

许多核心词语都收集在了这个文件里,可以自行查看。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值