IK分词器(elasticsearch插件)

最新推荐文章于 2024-06-23 10:47:41 发布

悬浮海

最新推荐文章于 2024-06-23 10:47:41 发布

阅读量294

点赞数

分类专栏： ES 文章标签： elasticsearch 搜索引擎 IK分词器-es插件

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wang_luwei/article/details/122399591

版权

ES 专栏收录该内容

11 篇文章 1 订阅

订阅专栏

ElasticSearch目录

文章目录

四、IK分词器(elasticsearch插件)

四、IK分词器(elasticsearch插件)

IK分词器：中文分词器

分词：即把一段中文或者别的划分成一个个的关键字，我们在搜索时候会把自己的信息进行分词，会把数据库中或者索引库中的数据进行分词，然后进行一一个匹配操作，默认的中文分词是将每个字看成一个词（不使用IK分词器的情况下），比如“我爱狂神”会被分为”我”，”爱”，”狂”，”神” ，这显然是不符合要求的，所以我们需要安装中文分词器ik来解决这个问题。

IK提供了两个分词算法: ik_smart和ik_max_word ，其中ik_smart为最少切分, ik_max_word为最细粒度划分!

4.1、下载

版本要与ElasticSearch版本对应

下载地址：https://github.com/medcl/elasticsearch-analysis-ik/releases

4.2、安装

ik文件夹是自己创建的

解压即可（但是我们需要解压到ElasticSearch的plugins目录ik文件夹下）

4.3、重启ElasticSearch

加载了IK分词器

4.4、查看插件

使用 ElasticSearch安装补录/bin/elasticsearch-plugin 可以查看插件

E:\ElasticSearch\elasticsearch-7.6.1\bin>elasticsearch-plugin list

4.5、使用kibana测试

4.5.1、`ik_smart`：最少切分

4.5.2、`ik_max_word`：最细粒度划分（穷尽词库的可能）

从上面看，感觉分词都比较正常，但是大多数，分词都满足不了我们的想法，如下例：

那么，我们需要手动将我们需要的词添加到分词器的字典当中

4.6、添加自定义的词添加到扩展字典中

elasticsearch目录/plugins/ik/config/IKAnalyzer.cfg.xml

打开 IKAnalyzer.cfg.xml 文件，扩展字典

创建字典文件，添加字典内容

重启ElasticSearch，再次使用kibana测试

smart

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
IK分词器(elasticsearch插件)

ElasticSearch目录文章目录四、IK分词器(elasticsearch插件)4.1、下载4.2、安装4.3、重启ElasticSearch4.4、查看插件4.5、使用kibana测试4.5.1、`ik_smart`：最少切分4.5.2、`ik_max_word`：最细粒度划分（穷尽词库的可能）4.6、添加自定义的词添加到扩展字典中四、IK分词器(elasticsearch插件)IK分词器：中文分词器分词：即把一段中文或者别的划分成一个个的关键字，我们在搜索时候会把自己的信息进行分词，会把
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

悬浮海 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。