es拼音分词 大帅哥_elasticsearch基础笔记6-elasticsearch 安装ik分词器

2aa881c6ed5188fec9fc41bd37eb9efc.png

1、下载

必须找到和es版本相对应的版本

1745b75b760b573deef036031ac6a8fc.png

2、解压

(如果已安装mvn工具, 则可以直接解压到 es目录 plugins下新建ik文件夹,解压至此即可。)

3、用maven工具编译

如果没有maven工具,则需要安装mvn工具。然后,进行编译和打包。

详见

4、启动

启动es ,看到如下信息,则ik启动成功。

0f51bda64ad47aece4e5ede62f49b289.png

5、验证ik分词器

GET _analyze

{

"analyzer": "ik_max_word"

, "text": "中华人民共和国万岁"

}

GET _analyze

{

"analyzer": "ik_smart"

, "text": "中华人民共和国万岁"

}

GET _analyze

{

"analyzer": "standard"

, "text": "中华人民共和国万岁"

}

38164a8eaf936feb211bbc5bff9f2e8b.png

ik_max_word 和 ik_smart 什么区别?

ik_max_word: 会将文本做最细粒度的拆分,比如会将"中华人民共和国国歌"拆分为"中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌",会穷尽各种可能的组合,适合 Term Query;

ik_smart: 会做最粗粒度的拆分,比如会将"中华人民共和国国歌"拆分为"中华人民共和国,国歌",适合 Phrase 查询。

常见的还有很多中文分词器,很多大学的实验室也在做相应的内容。

6、同理,拼音分词,请自行解决。、

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值