ES聚合结果出现sum_other_doc_count大于0

当terms聚合字段未设置size时,默认只查询10条数据,导致sum_other_doc_count大于0。要确保所有数据参与聚合,应设置size等于字段数据类型的数量。设置正确后,sum_other_doc_count将为0。
摘要由CSDN通过智能技术生成

ES在聚合、检索数据时,为了保证效率,在不对数量做主动设置时,只会用最小量的数。terms检索文档默认只会查询10条数据,想必大家都知道。其实,terms聚合时也是如此。
当我们给terms聚合字段没有设置size时,那ES“偷懒”就只会查询10条数据。
所以,你会发现,即使你查询了100条数据,聚合时,只出现了10条。并且会有sum_other_doc_count大于0。那到底改设置多少呢才合适呢?

Api中其实对数量也是有说明的,但是没有说这个数到底是什么。
org.elasticsearch.search.aggregations.bucket.terms.TermsAggregationBuilder#size(int)在这里插入图片描述

让我们一起探索一下吧:

下面举例:

当terms聚合字段的size值设置的比字段本身的类型少时,就会出现"sum_other_doc_count" 大于0。

这说明从分片是没有全部拿到我期望参与聚合的所有数据。

在这里插入图片描述

改进一下:
我们按照terms聚合字段的数据类型相同的数量,设置size值时,就会出现:"sum_other_doc_count" : 0,
在这里插入图片描述

这个时候所有期望参与聚合的数据,都参与了聚合。OK了。

所以,你学废了吗?

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值