elasticsearch ik分词器安装和使用

最新推荐文章于 2023-05-19 10:42:48 发布

ypp91zr

最新推荐文章于 2023-05-19 10:42:48 发布

阅读量250

点赞数

分类专栏： Elasticsearch java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ypp91zr/article/details/89326018

版权

java 同时被 2 个专栏收录

193 篇文章 3 订阅

订阅专栏

11 篇文章 0 订阅

订阅专栏

下载地址,选择对应版本https://github.com/medcl/elasticsearch-analysis-ik/releases

安装ik分词器

在 elasticsearch 目录中的 \plugins 目录下新建 ik 目录，然后将下载完成的 elasticsearch-analysis-ik 解压至此目录下。或者将压缩后的文件复制到ik目录下,分词器到这里就安装成功了

如果elasticsearch版本是6.x以下的。貌似要进入elasticsearch目录，进入config配置文件目录修改elasticsearch.yml,添加如下配置。6.x及以上不需要配置，配置反而启动不了，会报错

index.analysis.analyzer.ik.type : "ik"

重启elasticsearch

如果是集群有其他节点的话，其他节点同样的操作。安装步骤同样适用于linux，只是插件需要是linux的,或者在线打包安装

测试基本分词:

"analyzer":"ik_smart"

ik_smart:最粗粒度的分词

ik_max_word:最细粒度的分词

如果是"analyzer":"ik_max_word"最细粒度的就很多了:

{

"tokens": [
- {
  - "token": "中华人民共和国",
  - "start_offset": 0,
  - "end_offset": 7,
  - "type": "CN_WORD",
  - "position": 0
  }
- ,
- {
  - "token": "中华人民",
  - "start_offset": 0,
  - "end_offset": 4,
  - "type": "CN_WORD",
  - "position": 1
  }
- ,
- {
  - "token": "中华",
  - "start_offset": 0,
  - "end_offset": 2,
  - "type": "CN_WORD",
  - "position": 2
  }
- ,
- {
  - "token": "华人",
  - "start_offset": 1,
  - "end_offset": 3,
  - "type": "CN_WORD",
  - "position": 3
  }
- ,
- {
  - "token": "人民共和国",
  - "start_offset": 2,
  - "end_offset": 7,
  - "type": "CN_WORD",
  - "position": 4
  }
- ,
- {
  - "token": "人民",
  - "start_offset": 2,
  - "end_offset": 4,
  - "type": "CN_WORD",
  - "position": 5
  }
- ,
- {
  - "token": "共和国",
  - "start_offset": 4,
  - "end_offset": 7,
  - "type": "CN_WORD",
  - "position": 6
  }
- ,
- {
  - "token": "共和",
  - "start_offset": 4,
  - "end_offset": 6,
  - "type": "CN_WORD",
  - "position": 7
  }
- ,
- {
  - "token": "国",
  - "start_offset": 6,
  - "end_offset": 7,
  - "type": "CN_CHAR",
  - "position": 8
  }
- ,
- {
  - "token": "国歌",
  - "start_offset": 7,
  - "end_offset": 9,
  - "type": "CN_WORD",
  - "position": 9
  }
]

}

查询book带有相关关键词的数据

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
elasticsearch ik分词器安装和使用

下载地址,选择对应版本https://github.com/medcl/elasticsearch-analysis-ik/releases安装ik分词器在 elasticsearch 目录中的\plugins 目录下新建 ik 目录，然后将下载完成的elasticsearch-analysis-ik 解压至此目录下。或者将压缩后的文件复制到ik目录下,分词器到这里就安装成功了...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。