Redis详解之特殊数据类型HyperLogLog

Redis 在 2.8.9 版本添加了 HyperLogLog 结构。

Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定 的、并且是很小的。

在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基 数。这和计算基数时,元素越多耗费内存就越多的集合形成鲜明对比。

但是同样有一个缺点就是这个会有误差,标准误差是0.81%。这个就可以用到网站的uv(独立访问数),也就是说要判断一个网站到底有多少人访问,而不是访问量,一个人访问了多次只会算作一次。还例如现在的疫情,要算全中国的人数谁打了疫苗,这么大的数据量而又不需要一个精确的值,就可以使用由于HyperLogLog,应用还是非常广泛,这个是一个不太精确的数字,所以可以进行调优,可以使用分桶,调和平均数,细节微调等算法进行调优。有兴趣的可以自己查找资料。

但是,因为 HyperLogLog 只会根据输入元素来计算基数,而不会储存输入元素本身,所以 HyperLogLog 不能像集合那样,返回输入的各个元素。

因为这个算法应用很简单,就简单介绍一下。

首先需要了解一个概念就是基数:简单解释就是不重复的元素数量:例如{1,2,3,4,5,5,6,6}那么这个集合的基数就为6,那么看一下命令。

序号命令及描述
1PFADD key element [element ...]
添加指定元素到 HyperLogLog 中。
2PFCOUNT key [key ...] 这个就是上边的给定一个集合返回基数
返回给定 HyperLogLog 的基数估算值。
3PFMERGE destkey sourcekey [sourcekey ...] 将两个集合合并为一个
将多个 HyperLogLog 合并为一个 HyperLogLog

 如有问题请联系!!!!

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值