ES集成IK分词器

最新推荐文章于 2024-08-06 19:13:04 发布

笙箫123

最新推荐文章于 2024-08-06 19:13:04 发布

阅读量2k

点赞数 1

分类专栏： ElasticaSearch 文章标签： ES6 IK分词器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/q15102780705/article/details/101872729

版权

ElasticaSearch 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1、测试分词器

在添加文档时会进行分词，索引中存放的就是一个一个的词（term），当你去搜索时就是拿关键字去匹配词，最终

找到词关联的文档。

测试当前索引库使用的分词器：

post 发送：localhost:9200/_analyze

{"text":"测试分词器，后边是测试内容：spring cloud实战"}

结果如下：

会发现分词的效果将 “测试” 这个词拆分成两个单字“测”和“试”，这是因为当前索引库使用的分词器对中文就是单字

分词。

2 、安装IK分词器

使用IK分词器可以实现对中文分词的效果。

下载IK分词器：（Github地址：https://github.com/medcl/elasticsearch-analysis-ik）

下载zip：

解压，并将解压的文件拷贝到ES安装目录的plugins下的ik目录下

测试分词效果：

发送：post localhost:9200/_analyze

{"text":"测试分词器，后边是测试内容：spring cloud实战","analyzer":"ik_max_word" }

3、 两种分词模式

ik分词器有两种分词模式：ik_max_word和ik_smart模式。

1、ik_max_word

会将文本做最细粒度的拆分，比如会将“中华人民共和国人民大会堂”拆分为“中华人民共和国、中华人民、中华、

华人、人民共和国、人民、共和国、大会堂、大会、会堂等词语。

2、ik_smart

会做最粗粒度的拆分，比如会将“中华人民共和国人民大会堂”拆分为中华人民共和国、人民大会堂。

测试两种分词模式：

发送：post localhost:9200/_analyze

{"text":"中华人民共和国人民大会堂","analyzer":"ik_smart" }

4、 自定义词库

如果要让分词器支持一些专有词语，可以自定义词库。

iK分词器自带一个main.dic的文件，此文件为词库文件。

在上边的目录中新建一个my.dic文件（注意文件格式为utf-8（不要选择utf-8 BOM））

可以在其中自定义词汇：

比如定义：

配置文件中配置my.dic，

重启ES，测试分词效果：

发送：post localhost:9200/_analyze

{"text":"测试分词器，后边是测试内容：spring cloud实战","analyzer":"ik_max_word" }

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

笙箫123 CSDN认证博客专家 CSDN认证企业博客

码龄9年

197: 原创

3万+: 周排名

42万+: 总排名

67万+: 访问

: 等级

5200: 积分

184: 粉丝

375: 获赞

116: 评论

1378: 收藏

私信

关注

热门文章

分类专栏

杂谈 2篇
Shiro 4篇
多线程 3篇
bug记录 8篇
IDEA 15篇
JVM 2篇
RabbitMQ 9篇
redis 8篇
算法 34篇
架构 4篇
spring 3篇
mybatis 2篇
Token 2篇
设计模式 8篇
支付 3篇
git 8篇
ElasticaSearch 8篇
zookeeper 3篇
Linux 5篇
maven 3篇
web 9篇
java 54篇
spring cloud 12篇
spring boot 19篇
面试储备 23篇
分布式 20篇
mysql 12篇

最新评论

java的spring boot版本企业微信接入与自动回复消息
m0_56838537: 大佬群聊的消息也能获取到吗
java的spring boot版本企业微信接入与自动回复消息
xiaozhengitz: 您好，我想请问一下，接收外部客户的消息最后实现了吗，还是说外部客户都要加到应用里才行？
IDEA驼峰式命名插件CamelCase
Starry Sky001: 使用过程看这个：https://blog.csdn.net/DPXXMT/article/details/124174781
java的spring boot版本企业微信接入与自动回复消息
起名字可真难QAQ: 是哪两个包需要替换啊，求教，getInputStream返回null，报空指针错误
java的spring boot版本企业微信接入与自动回复消息
陌上花语: 大佬，请教一个问题，我用Java的方式调用企业微信发送message的接口，本地启动代码能发信息给企业微信添加的那个应用，但是在企业微信中发消息我本地后台没办法接收到，我应该怎么写呢?

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。