ES ik分词器安装 和 自定义词库

  1. 首先到 传送门 下载我们的elasticsearch 对应版本的ik分词器 , 下载 zip 文件:
    在这里插入图片描述
  2. 下载后,将压缩包解压,重命名为ik,然后 上传到elasticsearch 安装目录下面的 plugins 文件,然后重启ES
    ![在这里插入图片描述](https://img-blog.csdnimg.cn/20210329181611673.png在这里插入图片描述

在这里插入图片描述

3.标准分词器和中文分词器的分词效果
标准分词器: 将中文一个字一个字拆分
在这里插入图片描述
而ik 中文分词器则对中文的词组进行拆分
在这里插入图片描述

  1. 自定义词库
    4.1 首先建一个文本文档,添加自定义词库
    在这里插入图片描述
    4.2 将自定义词库另存为myword.dic文件 ,注意编码选择UTF-8:
    在这里插入图片描述
    4.3 将文件上传 到 ES安装路径/plugins/ik/config/customer

在这里插入图片描述

4.4 修改 ES安装路径/plugins/ik/config/IKAnalyzer.cfg.xml文件,配置自定义词库, 下面修改自定义的词库路径

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
        <comment>IK Analyzer 扩展配置</comment>
        <!--用户可以在这里配置自己的扩展字典 -->
        <entry key="ext_dict">/customer/myword.dic</entry>
         <!--用户可以在这里配置自己的扩展停止词字典-->
        <entry key="ext_stopwords"></entry>
        <!--用户可以在这里配置远程扩展字典 -->
        <!-- <entry key="remote_ext_dict">words_location</entry> -->
        <!--用户可以在这里配置远程扩展停止词字典-->
        <!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>

修改完,之后,重启ES!

未修改自定义词库之前的分词效果:
在这里插入图片描述

修改自定义词库之后的分词效果:

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值