一文读懂ElasticSearch中字符串keyword和text类型区别_elasticsearch text和keyword(1)

一切文本类型的字符串可以定义成 text文本类型keyword关键字类型两种类型。

区别在于,text类型(文本类型)会使用默认分词器分词,也就是存入的数据会先进行分词,然后将分完词的词组存入索引,当然你也可以为他指定特定的分词器。
text类型检索不是直接给出是否匹配,而是检索出相似度,并按照相似度由高到低返回结果。这样会导致本来我们认为应该查询出来的数据有可能会查询不到。

如果定义成keyword类型(关键字类型),那么默认就不会对其进行分词,原样存储。当一个字段需要按照精确值进行过滤、排序、聚合等操作时, 就应该使用keyword类型.
keyword类型检索,直接被存储为了二进制,检索时我们直接匹配,不匹配就返回false。所以精确匹配可以用keyword。

那为什么我们有时候使用查询条件时,查询条件里加keyword和不加keyword得到结果有时候和预想当中的不一样呢?看下面例子

3.示例

准备数据

PUT /test/_doc/1
{
  "name":"张三",
  "address":"广东深圳",
  "age":12
}

PUT /test/_doc/2
{
  "name":"李四",
  "address":"广西老表",
  "age":13
}

查看该索引的mapping,可以看到ES默认对字符串类型数据的mapping既有text也有keyword类型

GET /test/_mapping

在这里插入图片描述

3.1、match查询不加keyword(match查询会分析查询条件,先将查询条件进行分词,然后查询,求并集)

GET /test/_search
{
  "query": {
    "match": {
      "address":"广东深圳"
    }
  }
}

结果

在这里插入图片描述

查看索引中数据的分词结果 GET /test/_doc/1/_termvectors?fields=address

在这里插入图片描述
可以看到,这里的数据被ES分为了4个词分别是“广” ,“东”,“深”,“圳”。同样,第二条数据也被分为了“广” ,“西”,“南”,“宁”。这里可以理解为
keyword类型存储的数据为“广东深圳”(存储未分词的原始数据)
text类型存储的数据为“广” ,“东”,“深”,“圳”(存储分词后的)

之所以查到两条,原因是,match查询会将查询条件分词,
也就是查询条件(广东深圳)会被分词为“广” ,“东”,“深”,“圳”和原始数据“广东深圳”去查询,前面说了,字符串默认是既有text类型,又有keyword类型,没有加keyword,查询的就是text类型的,所以命中了两条数据

接下来加上keyword去查询看看结果会是怎么样

GET /test/_search
{
  "query": {
    "match": {
      "address.keyword":"广东深圳"
    }
  }
}

在这里插入图片描述
不出意外,只命中了一条

接下来查询条件由广东深圳–>广东深,结果会怎样呢

GET /test/_search
{
  "query": {
    "match": {
      "address.keyword":"广东深"
    }
  }
}

在这里插入图片描述

match查询不是会对查询条件分词吗?怎么一条都没有命中

原因是不管加没加keyword,只要是match查询,都会对查询条件进行分词,
但是加了keyword,ES只会去检索keyword类型里存储的数据,不加keyword,ES只会去检索text类型里存储的数据

3.2、term查询(不会分析查询条件,只有当词条和查询字符串完全匹配时才匹配,也就是精确查找)

term不加keyword

GET /test/_search
{
  "query": {
    "term": {
      "address":"广东深圳"
    }
  }
}


**自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。**

**深知大多数大数据工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!**

**因此收集整理了一份《2024年大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。**
![img](https://img-blog.csdnimg.cn/img_convert/07280282a6b305417e15fc9eb6bbb040.png)
![img](https://img-blog.csdnimg.cn/img_convert/f8156de23b958f9854fa7cc214808fab.png)
![img](https://img-blog.csdnimg.cn/img_convert/e5ee3f000a591f4db53df35a88fde899.png)
![img](https://img-blog.csdnimg.cn/img_convert/5970846440a04b59316a45b0667b9eae.png)
![img](https://img-blog.csdnimg.cn/img_convert/8f307fcf94905e440a935f799bbf0860.png)

**既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上大数据开发知识点,真正体系化!**

**由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新**

**如果你觉得这些内容对你有帮助,可以添加VX:vip204888 (备注大数据获取)**
![img](https://img-blog.csdnimg.cn/img_convert/b4db259343fb4868890b31cde6888137.png)

*由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新**

**如果你觉得这些内容对你有帮助,可以添加VX:vip204888 (备注大数据获取)**
[外链图片转存中...(img-GAag46De-1712874337832)]

  • 4
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值