ES修改分词规则，集成ik自定义分词

最新推荐文章于 2024-07-14 10:41:17 发布

Ellen_yy

最新推荐文章于 2024-07-14 10:41:17 发布

阅读量2.8k

点赞数

分类专栏：搜索引擎文章标签： ElasticSearch

本文链接：https://blog.csdn.net/Ellen_yy/article/details/103014236

版权

搜索引擎专栏收录该内容

1 篇文章 0 订阅

订阅专栏

elasticsearch在相关度排序的时候可能并不能满足所有需求，在title全部命中时评分也不一定高于不完全命中的词汇。因此需要自定义分词，提高权重。

1、集成ik分词器（具体怎么集成请自行百度，这里不多说了）

2、/elasticsearch/plugins/ik/config# cat IKAnalyzer.cfg.xml 查看自定义分词文件

<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">custom/mydict.dic;custom/single_word_low_freq.dic</entry>
 <!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">custom/ext_stopword.dic</entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->

3、/elasticsearch/plugins/ik/config/custom# vi mydict.dic修改mydict.dic文件

/usr/share/elasticsearch/plugins/ik/config/custom# vi mydict.dic
medcl
elastic
elasticsearch
kogstash
kibana
marvel
shield
watcher
beats
packetbeat
filebeat
topbeat
metrixbeat
XXX

修改完文件之后保存退出，重启es集群，查询XXX，可以查出XXX在最上方（权重最高！）