Redis之HyperLogLog

GoGo在努力

已于 2022-04-18 20:25:06 修改

阅读量225

点赞数

分类专栏： Redis 文章标签： redis golang

于 2022-03-29 11:19:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52690231/article/details/123816264

版权

Redis 专栏收录该内容

37 篇文章 2 订阅

订阅专栏

文章目录

Redis之HyperLogLog

Redis之HyperLogLog

注：本文是基于Linux系统上Redis v5.0.7进行讲解

1.基数

比如数据集 {1, 3, 5, 7, 5, 7, 8}，那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。基数估计就是在误差可接受的范围内，快速计算基数

在这里插入图片描述

2.HyperLogLog介绍

HyperLogLog 是用来做基数统计的算法，运用了LogLog的算法；
HyperLogLog 的优点是，在输入元素的数量或者体积非常非常大时，计算基数所需的空间总是固定的、并且是很小的。
在 Redis 里面，每个 HyperLogLog 键只需要花费 12 KB 内存，就可以计算接近 2^64 个不同元素的基数。这和计算基数时，元素越多耗费内存就越多的集合形成鲜明对比。
但是，因为 HyperLogLog 只会根据输入元素来计算基数，而不会储存输入元素本身，所以 HyperLogLog 不能像集合那样，返回输入的各个元素。

相关说明：
1.用于进行基数统计，不是集合，不保存数据，只记录数量而不是具体数据
2.核心是基数估算算法，最终数值存在一定误差
3.误差范围：基数估计的结果是一个带有 0.81% 标准错误的近似值
4.耗空间极小，每个hyperloglog key占用了12K的内存用于标记基数
5.pfadd命令不是一次性分配12K内存使用，会随着基数的增加内存逐渐增大
6.Pfmerge命令合并后占用的存储空间为12K，无论合并之前数据量多少

2.pfadd命令

Pfadd 命令将所有元素参数添加到 HyperLogLog 数据结构中;
如果至少有个元素被添加返回 1，否则返回 0

PFADD key element [element ...]

在这里插入图片描述

3.pcount命令

命令返回给定 HyperLogLog 的基数估算值;
返回给定 HyperLogLog 的基数值，如果多个 HyperLogLog 则返回基数估值之和

PFCOUNT key [key ...]

在这里插入图片描述

4.pgmerge命令

命令将多个 HyperLogLog 合并为一个 HyperLogLog ，合并后的 HyperLogLog 的基数估算值是通过对所有给定 HyperLogLog 进行并集计算得出的;
返回 OK

PFMERGE destkey sourcekey [sourcekey ...]

在这里插入图片描述

5.LogLog算法

在这里插入图片描述

6.HyperLogLog基本操作

在这里插入图片描述

7.HyperLogLog应用场景

1.应用于独立信息统计
2.供不精确的去重计数功能，比较适合用来做大规模数据的去重统计，例如统计 UV；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

GoGo在努力 CSDN认证博客专家 CSDN认证企业博客

码龄4年

579: 原创

4500: 周排名

33万+: 总排名

84万+: 访问

: 等级

6503: 积分

5万+: 粉丝

424: 获赞

71: 评论

1682: 收藏

私信

关注

热门文章

分类专栏

GoLang底层 216篇
Docker 6篇
计算机网络 51篇
GoLang 87篇
Linux 7篇
Casbin 11篇
Gin 33篇
Redis 37篇
Gorm 15篇
Git 3篇
GoLang设计模式 1篇
前端 2篇
Kfaka 1篇
MySql 90篇
Java 1篇
操作系统 13篇

最新评论

GoLang之如何优雅地关闭 channel(8)
Jenson Chen: 转发还请注明哦： https://www.bookstack.cn/read/qcrao-Go-Questions/channel-%E5%A6%82%E4%BD%95%E4%BC%98%E9%9B%85%E5%9C%B0%E5%85%B3%E9%97%AD%20channel.md
MySQL之隔离级别与锁的关系
t_mac521: 误导人哦
GoLang之同步系列一(内存乱序)
自由de单车: 博主你好，网上资料说，CPU为了提高性能，有可能会对代码执行顺序进行调整，比如 a=1; b=1，CPU有可能会先执行b=1，然后再执行a = 1，这种重排序的行为，属于Store-Store乱序的范畴吗？
GoLang之GMP常见问题总结
_Cooki_: G都放在了 P 的队列里面，M 哪里来的队列？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

GoGo在努力 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。