Hyperloglog
我们在传统的统计访问者的数量时,是通过set集合来存储用户的ID,set集合中储存的是无序,无重复的元素。以set中元素的数量来判断访问者的数量。
但是这种方式需要保存大量的用户ID,而且会占用大量内存。所以我们采用Redis Hyperloglog数据结构来实现。
Redis Hyperloglog数据结构的优点是:
占用内存的固定2^64不同元素的基数,只需要消耗12KB内存。
基数:元素中非重复数的个数。
测试使用
pfadd 创建元素
pfcount: 统计元素基数数量
pfmerge:取并集
127.0.0.1:6379> PFADD mykey a b c d e f g h i j k #创建一组元素mykey
(integer) 1
127.0.0.1:6379> PFCOUNT mykey #统计mykey元素的基数数量
(integer) 11
127.0.0.1:6379> pfadd mykey2 i j k l m n o p q #创建第二组元素mykey2
(integer) 1
127.0.0.1:6379> PFCOUNT mykey2
(integer) 9
127.0.0.1:6379> PFMERGE mykey3 mykey mykey2 #合并mykey和mykey2的交集-->mykey3
OK
127.0.0.1:6379> pfcount mykey3
(integer) 17
Bitmap
位存储
表示两个状态的都可以使用Bitmap。使用场景:用户活跃状况、打卡状态、登录状况等。
Bitmap位图也是一种数据结构,都是操作二进制位来进行记录,只有0和1两种状态。
以下以打卡为例:
setbit :set加入元素
getbit:查看元素的打卡状态
bitcount : 统计打卡天数
127.0.0.1:6379> setbit sign 0 1 #周一 打卡
(integer) 0
127.0.0.1:6379> setbit sign 1 1 #周二 打卡
(integer) 0
127.0.0.1:6379> setbit sign 2 1 #周三 打卡
(integer) 0
127.0.0.1:6379> setbit sign 3 1 #周四 打卡
(integer) 0
127.0.0.1:6379> setbit sign 4 1 #周五 打卡
(integer) 0
127.0.0.1:6379> setbit sign 5 1 #周六 打卡
(integer) 0
127.0.0.1:6379> setbit sign 6 0 #周日 没打卡
(integer) 0
127.0.0.1:6379> getbit sign 4
(integer) 1
127.0.0.1:6379> getbit sign 6
(integer) 0
127.0.0.1:6379> BITCOUNT sign
(integer) 6