Redis数据结构之HyperLogLog

Redis HyperLogLog是一种用于基数统计的算法,仅需12KB内存即可估算接近2^64个不同元素的基数。适用于大规模数据集的基数估算,如统计注册IP数、访问IP数等。其缺点是无法获取具体数据内容,但通过pfadd、pfcount和pfmerge等命令,可以进行元素添加、基数估算和HyperLogLog合并。虽然存在0.81%的标准误差,但在内存效率和大数据处理上具有优势。
摘要由CSDN通过智能技术生成

简介

redis在2.8.9版本添加 了HyperLogLog结构,Redis HyperLogLog是用来做基数统计的算法,HyperLogLog优点是,在输入元素的数量或者体积非常大时,计算基数所需的空间总是固定的,并且是很小的。
在redis里面,每个HyperLogLog键只需要花费12kb内存,就可以计算接近2^64个不同元素的基数,这和计算基数时,元素越多耗费内存就越多的集合形成鲜明对比,但是因为HyperLogLog只会根据输入元素来计算基数,而不会存储输入元素本身,所以HyperLogLog不能像集合那样,返回输入的各个元素。

什么是基数?
数据集{1,3,5,7,5,7,8},那么这个数据集的基数集为{1,3,5,7,8},基数(不重复元素)为5,基数估计就是在误差可接受的范围内,快速计算基数。

为什么需要HyperLogLog?
如果统计一亿个数据的基数值,大约需要内存100000000/8/1024/1024 大约12M,内存减少占用的效果显著。
然而统计一个的对象的基数值需要12M,如果统计10000个对象就需要将近120G,同样不能广泛用于大数据

常用语法命令

1、添加指定元素到HyperLogLog中

PFADD key element [element
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值