Hyperloglogs
1.什么是基数
集合中不重复元素的个数:A{ a, b ,c ,d ,e c } 集合基数为5.
2.什么是Hyperloglogs
- 是一种概率数据结构,用于统计唯一的事物(从技术上讲,这是指估计集合的基数。
- 算法是用内存换取精度的:一个标准误差作为结束的估计值,误差小于1%。
- 最多内存不会超过12k bytes
3.统计元素与添加值:pfcount 与 pfadd
127.0.0.1:6379> pfadd mykey a b c d e f g i j k
(integer) 1
127.0.0.1:6379> pfcount mykey
(integer) 10
127.0.0.1:6379> pfadd mykey2 a b c d
4.并集:pfmerge
127.0.0.1:6379> pfmerge mykey3 mykey mykey2
OK
127.0.0.1:6379> pfcount mykey3
(integer) 10