ElasticSearch安装中文分词器

  1. 下载并安装ik分词插件。 ik分词官网: https://github.com/medcl/elasticsearch-analysis-ik
方式一(推荐):
./elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.0/elasticsearch-analysis-ik-7.12.0.zip

方式二:
a. 在plugins目录下创建目录ik, 并把上述的zip压缩包里的内容解压到ik目录中。
b. 更改ik目录的所有者为ElasticSearch的启动账号
   chown -R es ./ik/
c. 修改ik分词器下面的plugin-descriptor.properties文件
vim ./plugin-descriptor.properties
将其中的
elasticsearch.version=7.12.0
改成ElasticSearch的版本, 如
elasticsearch.version=7.12.0
  1. 重启ElasticSearch

  2. IK分词器提供了两种analyzer,分别是ik_max_word和ik_smart

ik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,国,国歌”,会穷尽各种可能的组合。
ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”。

  1. 测试IK分词器
GET _analyze
{
  "text" : "中华人民共和国国歌",
  "analyzer": "ik_max_word"
}

GET _analyze
{
  "text" : "中华人民共和国国歌",
  "analyzer": "ik_smart"
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值