IK分词器下载、使用和测试

对于Win10x86、Ubuntu环境均适用~

1.下载

为什么要使用IK分词器呢?最后面有测评~

访问:https://github.com/medcl/elasticsearch-analysis-ik/releases,找到与自己的ES相同的版本,
可以下载源码,然后自己编译,也可以直接下载编译好的压缩包,比如我这里是5.4.0版本:

这里写图片描述

如果选择下载源码然后自己编译的话,使用maven进行编译:
在该目录下,首先执行:mvn compile;,会生成一个target目录,然后执行mvn package;,会在target目录下生成一个releases目录,在该目录下有一个压缩包,这就是编译好的,与直接下载编译好是一样的~

或者把该项目在IDEA打开,在客户端执行maven的clearcompilepackage命令,效果都是一样的,但是用命令行编译好像稍微快一点~

2.使用

在es目录下的plugins目录下创建一个新文件夹,命名为ik,然后把上面的压缩包中的内容解压到该目录中。

比如在Ubuntu中,把解压出来的内容放到es/plugins/ik中:

这里写图片描述

之后,需要重新启动es

3.测试

1). 创建索引,指定分词器为“ik_max_word”

PUT index
{
  "settings": {
    "number_of_shards": 3,
    "number_of_replicas": 1,
    "analysis": {
      "analyzer": {
        "ik": {
          "tokenizer": "ik_max_word"
        }
      }
    }
  },
  "mappings": {
    "test1":{
      "properties": {
        "content": {
          "type": "text",
          "analyzer": "ik",
          "search_analyzer": "ik_max_word"
        }
      }
    }
  }
}

2). 写入数据到索引中

POST index/test1/1 
{
  "content": "里皮是一位牌足够大、支持率足够高的教练"
}
POST index/test1/2
{
  "content": "他不仅在意大利国家队取得过成功"
}
POST index/test1/3
{
  "content": "教练还带领广州恒大称霸中超并首次夺得亚冠联赛"
}

3). 执行搜索,比如匹配有“教练”字样的文档

GET index/_search
{
  "query": {
    "match": {
      "content": "教练"
    }
  },
  "highlight": {
    "pre_tags": ["<span style = 'color:red'>"],
    "post_tags": ["</span>"],
    "fields": {
  "content": {}}
  }
}

4). 搜索效果

{
  "took": 8,
  "timed_out": false,
  "_shards": {
    "total": 3,
    "successful": 3,
    "failed": 0
  },
  "hits": {
    "total": 2,
    "max_score": 
  • 6
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
你可以通过以下步骤在Linux上下载ik分词器。首先,前往ik分词器下载地址https://github.com/medcl/elasticsearch-analysis-ik/releases并下载最新版本的ik分词器。 接下来,将下载ik分词器安装包直接放在Elasticsearch的plugins文件夹下,并解压。如果你需要配置自定义词典,可以将你的.dic文件放在解压后的IK分词器的config文件夹中。同时,在IKAnalyzer.cfg.xml文件中添加扩展词典或自定义的停词词典,用英文分号(;)分隔。 另外,如果你遇到了问题,比如使用了最新版本的Elasticsearch,而ik分词器的最新版本没有跟上,建议确保你使用的ES-IK分词插件版本与你安装的Elasticsearch版本相对应。 通过以上步骤,你就可以在Linux上成功下载ik分词器了。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [Linux下安装ik分词器](https://blog.csdn.net/u013901132/article/details/125355713)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [6.8.5IK分词器](https://download.csdn.net/download/Tomcat_wr8/12253113)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值