ES修改分词规则,集成ik自定义分词

elasticsearch在相关度排序的时候可能并不能满足所有需求,在title全部命中时评分也不一定高于不完全命中的词汇。因此需要自定义分词,提高权重。

1、集成ik分词器(具体怎么集成请自行百度,这里不多说了)
2、/elasticsearch/plugins/ik/config# cat IKAnalyzer.cfg.xml 查看自定义分词文件
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">custom/mydict.dic;custom/single_word_low_freq.dic</entry>
 <!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">custom/ext_stopword.dic</entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
3、/elasticsearch/plugins/ik/config/custom# vi mydict.dic修改mydict.dic文件

/usr/share/elasticsearch/plugins/ik/config/custom# vi mydict.dic
medcl
elastic
elasticsearch
kogstash
kibana
marvel
shield
watcher
beats
packetbeat
filebeat
topbeat
metrixbeat
XXX

修改完文件之后保存退出,重启es集群,查询XXX,可以查出XXX在最上方(权重最高!)

注意:由于代码中指定集群setting为"ik_smart"粗粒度分词,在自定义分词之后不会对XXX分词查询,根据需求我选用了"ik_max_word"进行细粒度分词。

4、以下是我的验证

在这里插入图片描述
在这里插入图片描述
(做映射!!!)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值