【ElasticSearch】ElasticSearch中字符串.keyword和.text类型区别和模糊查询

猩火燎原

已于 2022-10-18 14:30:52 修改

阅读量3.6w

点赞数 22

分类专栏：面试相关中间件文章标签： elasticsearch 搜索引擎大数据

于 2021-06-21 16:03:27 首次发布

本文链接：https://blog.csdn.net/sfh2018/article/details/118083634

版权

面试相关同时被 2 个专栏收录

12 篇文章

订阅专栏

中间件

7 篇文章

订阅专栏

本文探讨了ES中text与keyword类型的区别，如何为text添加keyword支持，以及如何利用keyword进行精确模糊查询。重点介绍了如何在实际场景中避免分词带来的查询困扰，并提供实例说明和实用建议。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在使用es对某个字符串字段进行模糊查询的时候，可能因为该字段是text类型而搜索不到，因为text类型会将字符串进行分词之后存入索引，那么我们在模糊查询的时候其实是基于已分词的词组进行的模糊查询，这样会导致本来应该查询出来的数据有可能会查询不到。所以可以通过keyword来进行精确匹配，这里记录一下对es的text和keyword的理解和使用，有不足的欢迎码友指正。

文章目录

一、text和keyword类型介绍

1.ES5.0及以后的版本取消了string类型，将原先的string类型拆分为text和keyword两种类型。它们的区别在于text会对字段进行分词处理而keyword则不会进行分词。
也就是说如果字段是text类型，存入的数据会先进行分词，然后将分完词的词组存入索引，而keyword则不会进行分词，直接存储。

2.text类型的数据被用来索引长文本，例如电子邮件主体部分或者一款产品的介绍，这些文本会被分析，在建立索引文档之前会被分词器进行分词，转化为词组。经过分词机制之后es允许检索到该文本切分而成的词语，但是text类型的数据不能用来过滤、排序和聚合等操作。
keyword类型的数据可以满足电子邮箱地址、主机名、状态码、邮政编码和标签等数据的要求，不进行分词，常常被用来过滤、排序和聚合。

3.当我保存一个字符串字段时，es自动生成的该字段的mapping是text + keyword(es版本7.9.0)。
在这里插入图片描述
4.当我想要不分词进行查询的时候，可以加上.keyword进行查询，比如：

"term": {
    "name.keyword": "测试名称"
}

二、给text类型添加keyword

如果在创建index的时候给某个字段指定了类型text，但是之后又想给它追加上keyword以便按完整字符串搜索。可以通过PUT命令实现。
使用命令：

PUT /user_index/_mapping
{
  "properties":{
    "name" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }
  }
}