[015]Redis | HyperLogLog应用场景

最新推荐文章于 2024-04-29 11:20:29 发布

Zero Ice

最新推荐文章于 2024-04-29 11:20:29 发布

阅读量196

点赞数

分类专栏： [015]Redis 文章标签： HyperLogLog应用场景 Redis

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41593408/article/details/106372029

版权

[015]Redis 专栏收录该内容

27 篇文章 0 订阅

订阅专栏

一、HyperLogLog

备注：

上图来源于《Redis官网-Redis HyperLogLog》

二、为什么要使用HyperLogLog？

HyperLogLog是一种算法，并非redis独有
目的是做基数统计，故不是集合，不会保存元数据，只记录数量而不是数值。
耗空间极小，支持输入非常体积的数据量
核心是基数估算算法，主要表现为计算时内存的使用和数据合并的处理。最终数值存在一定误差。
redis中每个hyperloglog key占用了12K的内存用于标记基数（官方文档）
pfadd命令并不会一次性分配12k内存，而是随着基数的增加而逐渐增加内存分配；而pfmerge操作则会将sourcekey合并后存储在12k大小的key中，这由hyperloglog合并操作的原理（两个hyperloglog合并时需要单独比较每个桶的值）可以很容易理解。
误差说明：基数估计的结果是一个带有 0.81% 标准错误（standard error）的近似值。是可接受的范围
Redis 对 HyperLogLog 的存储进行了优化，在计数比较小时，它的存储空间采用稀疏矩阵存储，空间占用很小，仅仅在计数慢慢变大，稀疏矩阵占用空间渐渐超过了阈值时才会一次性转变成稠密矩阵，才会占用 12k 的空间

三、应用场景

用于数据量大的场景，有局限性，只能统计基数数量，无法知道具体内容是什么！！！

统计访问量(IP数)
统计在线用户数
统计每天搜索不同词条的个数
统计文章真实阅读数
...

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[015]Redis | HyperLogLog应用场景

一、HyperLogLog备注：上图来源于《Redis官网-Redis HyperLogLog》二、为什么要使用HyperLogLog？HyperLogLog是一种算法，并非redis独有目的是做基数统计，故不是集合，不会保存元数据，只记录数量而不是数值。耗空间极小，支持输入非常体积的数据量核心是基数估算算法，主要表现为计算时内存的使用和数据合并的处理。最终数值存在一定误差。 redis中每个hyperloglog key占用了12K的内存用于标记基数（官方文档）..
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。