ik分词器的配置

在使用elasticsearch的时候,免不了要使用分词器,ik分词器就是其中的一种.关于ik分词器怎么和elasticsearch结合,我将在另外的文章中写,这篇文章主要说的是ik分词器的一些配置.

打开 %/config/elasticsearch.yml %/文件,加入以下配置:

index.analysis.analyzer.ik.type:"ik"

# index:

# analysis:

#   analyzer:

#     ik_syno:

#         type: custom

#         tokenizer: ik_max_word       

#     ik_syno_smart:

#         type: custom

#         tokenizer: ik_smart

以上配置定义了 ik_syno ik_syno_smart 这两个新的 analyzer,分别对应 IK ik_max_word ik_smart 两种分词策略。根据 IK 的文档,二者区别如下:

·        ik_max_word:会将文本做最细粒度的拆分,例如「中华人民共和国国歌」会被拆分为「中华人民共和国、中华人民、中华、华人、人民共和国、人民、人、民、共和国、共和、和、国国、国歌」,会穷尽各种可能的组合;

·        ik_smart:会将文本做最粗粒度的拆分,例如「中华人民共和国国歌」会被拆分为「中华人民共和国、国歌」;

配置前查询结果:

 

配置后ik_max_word

 

配置后ik_smart

 

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值