elasticsearch-8.1.2配置 IK 分词器

The IK Analysis plugin integrates Lucene IK analyzer into elasticsearch, support customized dictionary.

IK分词器是一个中文分词器插件,支持用户自定义词典;

(1)安装

GitHub下载链接:https://github.com/medcl/elasticsearch-analysis-ik

注意下载的 IK 版本 ES 版本 相对应,点击右边的 Releases 进入版本选择页面;

下载第一个 zip 包;

 在 ES 安装目录的 plugins 目录下创建 ik 文件夹,将 zip 解压后的文件转移进去;

 重启 elasticsearch.bat,成功加载 ik 插件;

注意:

如果遇到这样的报错, 是因为路径中带有空格!记得 ES 路径中千万不要带空格

(2)测试

IK 分词器提供2中分词模式,ik_smart ik_max_word

其中 ik_smart 为最粗粒度切分,ik_max_word 为最细粒度切分;

  • 测试 ik_smart 模式:

  • 测试 ik_max_word 模式:

(3)自定义用户字典

修改 ik 目录中 config 文件夹下的 IKAnalyzer.cfg.xml 文件;

ext.dic 文件中添加扩展词库,在 stopword.dic 文件中添加停用词;两文件均在当前目录下,与 IKAnalyzer.cfg.xml 在同一文件夹;

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值