03,es分词器

最新推荐文章于 2024-08-23 16:41:49 发布

李乃龙1

最新推荐文章于 2024-08-23 16:41:49 发布

阅读量129

点赞数

分类专栏： ElasticSearch 文章标签： elasticsearch 大数据

本文链接：https://blog.csdn.net/w7635122886/article/details/128571998

版权

4 篇文章 0 订阅

订阅专栏

1，标准分词器

按单词分，中文按字分，过滤标点符号

POST /_analyze
{
  "analyzer":"standard",
  "text":"我是中国人,this is good MAN!"
}

在这里插入图片描述

去掉标点，英文按单词分，中文不分

POST /_analyze
{
  "analyzer":"simple",
  "text":"我是中国人,this is good MAN!"
}

在这里插入图片描述

中文按空格分，不去标点

POST /_analyze
{
  "analyzer":"whitespace",
  "text":"我是中国 人,this is good MAN!"
}

在这里插入图片描述

https://github.com/medcl/elasticsearch-analysis-ik/releases

解压下载的ik分词器zip包，
并上传到/opt/dockerVolume/esVolume/elasticsearch/plugins


POST /_analyze
{
  "analyzer":"ik_smart",
  "text":"中华人民共和国国歌"
}

在这里插入图片描述

POST /_analyze
{
  "analyzer":"ik_max_word",
  "text":"中华人民共和国国歌"
}

在这里插入图片描述

PUT /text
{
  "mappings": {
    "properties": {
      "title":{
        "type": "text",
        "analyzer": "ik_max_word"
      }
    }
  }
}

在这里插入图片描述

PUT /text/_doc/1
{
  "title":"今天是中国成立多少年,应该放中华人民共和国国歌"
}

GET /text/_search
{
  "query": {
    "term": {
      "title": {
        "value": "应该"
      }
    }
  }
}

在这里插入图片描述

有些词语不是关键词，但是也希望被es当成关键词检索，可以把这些词放入扩展词词典

有些词语是关键词，但是业务不希望他们被检索到，可以把这些词放入词典

进入/opt/dockerVolume/esVolume/elasticsearch/plugins/elasticsearch-analysis-ik-7.14.0/config目录下，
在IKAnalyzer.cfg.xml文件中配置扩展词和停用词

extra_main.dic扩展词典
stopword.dic停用词典

关注

专栏目录