elasticsearch分组统计性能优化

最新推荐文章于 2024-08-09 19:00:00 发布

xuyingzhong

最新推荐文章于 2024-08-09 19:00:00 发布

阅读量3.1k

点赞数 1

Terms aggregation默认的计算方式并非直观感觉上的先查询，然后在查询结果上直接做聚合。

最近用es做数据统计时，增加了一个统计维度，发现查询性能下降了十几倍，查询es文档发现

Terms Aggregation 的计算方式主要有以下两种：

map，在内存中构建映射表，利用映射表完成聚合计算，可以看得出，这种方式会比较消耗内存。

global_ordinals，每个桶都会有一个全局序列号，也就是指定域中的唯一值都会有一个全局序列号，根据这个序列号完成相关的聚合过程。计算过程消耗的内存较小，因为使用全局序列号的话可以将计算中的中间结果存储到硬盘等存储介质中。

es java api 做聚合时默认的是第二种，消耗内存少，但时间长，评估了一下内存，果断采用第一种，设置executionHint即可，如：

AggregationBuilder ipAggregation = AggregationBuilders.terms("xx").field("xx").executionHint("map");
修改了之后，查询性能提升了十几倍，达到目的，且没出现oom

AggregationBuilder field = AggregationBuilders.terms("view_column").field("view_column")
.executionHint("map")
;

或者
TermsAggregationBuilder field = AggregationBuilders.terms("view_column").field("view_column")
.executionHint("map")
;

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。