ES terms聚合统计性能优化实践

最新推荐文章于 2024-04-30 09:32:34 发布

家里有两条小泰迪

最新推荐文章于 2024-04-30 09:32:34 发布

阅读量6.1k

点赞数 3

文章标签： Elasticsearch terms 性能优化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aaronjcq/article/details/81511224

版权

一、terms聚合统计，initialise 阶段的耗时，有助于我们调整对应 aggs 的 execution_hint 参数选择？

map：过滤之后，实际纳入统计的doc数量特别少，但是字段总的term数量超级多

适用场景：
过滤完之后，纳入统计的doc很少
不适用场景：
过滤完之后，纳入统计的doc很多

global_ordinals：过滤之后，实际纳入统计的doc数量特别多，但是字段总的term数量很少

适用场景：
过滤完之后，纳入统计的doc很多，但是terms聚合字段，总的token很少（即该字段数据不离散）
不适用场景：
terms聚合字段，总的token超级多

Terms aggregation默认的计算方式并非直观感觉上的先查询，然后在查询结果上直接做聚合。

ES假定用户需要聚合的数据集是海量的，如果将查询结果全部读取回来放到内存里计算，内存消耗会非常大。因此ES利用了一种叫做global ordinals的数据结构来对聚合的字段来做bucket分配，这个ordinals用有序的数值来代表字段里唯一的一个字符串，因此为每个ordinals值分配

最低0.47元/天解锁文章

家里有两条小泰迪

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
ES terms聚合统计性能优化实践

1、terms聚合统计，initialise 阶段的耗时，有助于我们调整对应 aggs 的 execution_hint 参数选择？ map：过滤之后，实际纳入统计的doc数量特别少，但是字段总的term数量超级多适用场景：过滤完之后，纳入统计的doc很少不适用场景：过滤完之后，纳入统计的doc很多global_ordinals：过滤之后，实际纳入统计的doc数量特别多，但是...
复制链接

扫一扫

家里有两条小泰迪 CSDN认证博客专家 CSDN认证企业博客

码龄16年

3: 原创

63万+: 周排名

216万+: 总排名

9325: 访问

: 等级

130: 积分

1: 粉丝

3: 获赞

3: 评论

13: 收藏

私信

关注

热门文章

最新评论

ES terms聚合统计性能优化实践
道友，且慢: 讲的不错
ThreadLocal深入理解
家里有两条小泰迪回复下个路口见_20: 我理解的这个ThreadLocal对象是所有线程里都是一样的，它主要作用是通过ThreadLocal计算ThreadLocalMap的哈希值，从而获取ThreadLocalMap中所存储真实对象的。
ThreadLocal深入理解
下个路口见_20: 你好，请问map.set(this, value);这个this表示的ThreadLocal实例是不是所有线程的都一样

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。