ElasticSearch text和keyword数据类型的区别

正经学徒,佛系记录,不搞事情

2.*的版本,字符串类型为string

5.*之后的版本,字符串类型区分为keyword和text,设置string字段会提示为过时类型

最大的区别在于:

  • keyword:存储数据时不会分词建立索引,常用于对文档进行过滤、排序、聚合的操作
  • text:存储数据会自动分词,并生成索引,用于全文索引的字段

由此两种类型的对应使用场景就不同了,这里创建一个person索引,新增两个字段str_keywordstr_text,类型分别对应keywordtext

添加一条记录

判断两个字段的分词情况

可见keyword未被分词,而text被分词成just、test

所以进行term查询时,str_keyword将查询不到记录,因为被分词成just、test

另一个方面,进行聚合查询时,keyword可以直接执行,且效率更高,而text聚合时需要特定的给字段启用Fielddata,而启用Fielddata将会导致消耗大量堆空间,更多关于 Fielddata 可点击查看。

添加数据进行聚合测试:

keyword类型可直接聚合

text类型无法直接聚合

提示“Fielddata is disabled on text fields by defaul”,“Fielddata默认禁用”,需要手动设置启用

再次进行查询时查询成功

注:虽然能够通过设置fielddata让text类型也支持聚合、排序等操作,但是尽量避免使用该方式。

推荐做法:

  1. 将需要排序、聚合的字段类型设置为keyword类型。
  2. 如果该字段一定需要text类型来作全文检索,则添加一个类型为keyword的新字段与之对应,单独用于作聚合、排序操作
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

My name is Red ^^

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值