Redis之HyperLogLog算法原理

最新推荐文章于 2024-05-02 18:10:08 发布

置顶

Pekue

最新推荐文章于 2024-05-02 18:10:08 发布

阅读量333

点赞数

分类专栏：编程文章标签： redis 概率论大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Pekue/article/details/125479017

版权

引入

针对问题

针对用户访问量或活跃量进行统计，由于可能数量级较大，所以直接采用HashMap的方式会占用大量内存，不可取。并且，也因为数量级较大，所以最终的统计结果存在较小的偏差时可接受的
因此，Redis基于此，引入了HyperLogLog结构来处理大数量级的统计问题

发展

伯努利试验

为什么HyperLogLog可以通过较少的内存(官方解释可以通过12K内存就能统计2^64个数据)，主要依靠概率论中的伯努利试验
实验的典故源于抛硬币，每次抛出硬币最终出现正方面的概率为50%。假设一直抛硬币，直到出现正面为止，记录为一次完整的试验
对于n次伯努利试验，意味着出现了n次正面，假设每次需要的次数为k_n，则必然会有一个kn的最大值记为k_max，基于极大似然估算的方法，发现存在估算关联n = 2 ^ k_max

优化

做n次伯努利试验进行一次估算，可以称为一轮，仅作一轮估算时误差率会较大，因此我们

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
Redis之HyperLogLog算法原理

Redis HyperLogLog算法原理
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。