elasticsearch-ik分词器

最新推荐文章于 2024-08-13 17:43:38 发布

菁菁兰花月

最新推荐文章于 2024-08-13 17:43:38 发布

阅读量1.2k

点赞数

文章标签： elasticsearch 搜索引擎大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36779138/article/details/122128617

版权

这里用的分词器版本是elasticsearch-analysis-ik-7.16.1.zip，和elasticsearch是相同的版本，这样不容易出错。

每个节点的elasticsearch中都要安装elasticsearch-analysis-ik。

安装过程

1. linux安装zip解压器

yum -y install unzip

2. 在原来的elasticsearch安装目录中的plugins目录下创建一个名为ik的文件夹

mkdir -p /usr/local/elasticsearch-7.16.1/plugins/ik

3. 把elasticsearch-analysis-ik-7.16.1.zip压缩包解压到elasticsearch安装目录ik的文件夹下

unzip elasticsearch-analysis-ik-7.16.1.zip -d /usr/local/elasticsearch-7.16.1/plugins/ik

4. 安装ik完成，启动elasticsearch

设置mapping(给分词器设置分词的规则)

Analyzer分词配置解释：

Ik_smart:粗粒度分词，比如中华人民共和国国歌，会拆分为中华人民共和国，国歌;
Ik_max_word:细粒度分词，比如中华人民共和国国歌，会拆分为中华人民共和国，中华人民，中华，华人，人民共和国，人民，人，民，共和国等各种组合，会穷尽各种可能的组合。

关于字段类型type配置解释：

Text数据类型被用来索引长文本，这些文本会被分析，在建立索引前会将这些文本进行分词，转化为词的组合，建立索引。允许ES来检索这些词语。Text数据类型不能用来排序和聚合。
Keyword数据类型用来建立电子邮箱地址，姓名，邮政编码和标签等数据，不需要进行分词。可以被用来检索过滤，排序和聚合。Keyword类型字段只能用本身来进行检索。
当然还有其他类型，比如Double等

用命令行去创建索引，添加，查询（测试时可以这样写）。

1. 创建索引ik

在这里插入图片描述

2. 添加分词规则（设置映射）

在这里插入图片描述

3. 在ik索引中添加内容

在这里插入图片描述

4. 查询数据

在这里插入图片描述

查询出两条符合的记录

在这里插入图片描述

注：上面用“中”是查询不到任何记录的。

如果有一些名词，不能让分词器拆分，需要配置一下。

1.打开/usr/local/elasticsearch-7.16.1/plugins/ik/config目录

2.创建custom.dic文件，写入不能拆分的词语

3.打开IKAnalyzer.cfg.xml，将新建的custom.dic配置其中

在这里插入图片描述

4.重启elasticsearch服务器。

菁菁兰花月

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。