7安装ik分词器_ElasticSearch学习笔记(二):IK分词器的使用

IK分词器

什么是IK分词器?

分词即把一段中文或者别的划分成一个个的关键字,我们在搜索时候会把自己的信息进行分词,会把数据库中或者索引库中的数据进行分词,然后进行一个匹配操作,默认的中文分词是将每个字看成一个词,比说说“我爱中国”会被分为“我”,“爱”,“中”,“国”,这显然是不符合要求的,所以我们需要安装中文分词器IK来解决这个问题。

IK提供了两个分词算法:ik_smart和ik_max_word,其中ik_smart为最少切分,ik_max_word为最细粒度划分。

安装

下载完毕,解压到elasticsearch的plugins下

360f67249978a01c616fa8cb8cfdd12d.png

使用kibana测试

  1. 使用ik_smart分词算法测试

    c065aeba344cfa09432a3d5ea80b53a5.png
  2. 使用ik_max_word分词算法测试

    97e9cef633a68f79537f0a28aeb88579.png

IK分词器增加自己的字典

  1. 查询“一碗小米粥”得到下面的结果

    998d2b49952f44b031d0a8c465398da2.png
  2. 需要在IK插件的config路径下的IKAnalyzer.cfg.xml进行配置自己的字典

    <?xml  version="1.0" encoding="UTF-8"?>
    properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
    <properties>
     <comment>IK Analyzer 扩展配置comment>
     
     <entry key="ext_dict">xiaomizhou.dicentry>
      
     <entry key="ext_stopwords">entry>
     
     
     
     
    properties>
  3. 设置自己的字典xiaomizhou.dic

    9341b4931b6217b0cc1de9f7e65f7c26.png
  4. 重启ES加载词典,重新进行测试

    c16bff4b1f4ca3fce2e4fb3d9a76afa5.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值