setbit实现活跃用户统计

通过《The Little Redis Book》看到有这样一篇博文《REDIS BITMAPS – FAST, EASY, REALTIME METRICS》,这次就不翻译了,已经有其他中文的版本。写这个目的在于一开始没看懂,想把整个详细的思想写出来。

先看setbit的使用。https://redis.io/commands/setbit。


先说位图,bitmap,根据二进制不同位置的值即可表示其代表的值。这就让我想起了上过的数字图像处理了。


setbit(key,offset,value) 
offset是从左往右算的位数,从零开始,即高位往低位的值,例如100011,offset为0的时候值为1, 4和5的值都为1。
本身redis存储字符串,以二进制格式存储。
所以文章里面的配图是错的。反过来了。


返回值是0和1,表示的是,设置前该offset位置下bit的值。

The offset argument is required to be greater than or equal to 0, and smaller than 2^32 (this limits bitmaps to 512MB)
bitmap本身offset的限制就是0到2^32,内存限制为521MB,分配所需时间才几百ms,刚刚好是2^32个bit,也就是4294967296,也就是说,offset最大能去到4294967296-1去。有四十二亿。


照着文章作者的思路。他们网站封顶有1亿多的用户。每个用户都有自己的用户ID。一个用户做操作,我们有个40多亿长度全为0的位图。
我们只需要在这个根据ID做位置定位(即offset偏移)将其改为1就算记录了该用户的操作了。每个用户的id不一样,将日期作为key,然后根据用户id的唯一性作为offset偏移。需要保证用户id不会超过4294967296-1。


而要统计一天用多少用户做操作(为什么说操作不说登录了,因为不仅仅限于登录,浏览某某东西,写日记等等都可以用这种方法)
,除去重复,总数就是这个位图里面值为1的个数。

将文章的代码具体实现了一下。

Jedis j = new Jedis("localhost");
//auth password
j.auth("myredis");
 
//2016-12-3  login operation user
j.setbit("login:2016-12-3".getBytes(), 1, true);
j.setbit("login:2016-12-3".getBytes(), 124431, true);
j.setbit("login:2016-12-3".getBytes(),1231, true);
j.setbit("login:2016-12-3".getBytes(), 323121, true);
BitSet b = BitSet.valueOf(j.get("login:2016-12-3".getBytes()));
 
//the number of bit value 1
int lognum3 = b.cardinality();
System.out.println("2016-12-3  login user number: "+lognum3);
 
 
//2016-12-3  login operation user
j.setbit("login:2016-12-4".getBytes(), 1, true);
j.setbit("login:2016-12-4".getBytes(), 1231231, true);
j.setbit("login:2016-12-4".getBytes(), 334441, true);
BitSet b2 = BitSet.valueOf(j.get("login:2016-12-4".getBytes()));
 
int lognum4 = b2.cardinality();
System.out.println("2016-12-4  login user number: "+b2.cardinality());
 
b.or(b2);
//or操作之后 同样userid的记录会重合不做记录,所以具体的数据统计看自己的需求而定
int lognumexceptsameuser = b.cardinality();
int logtotalnum = lognum3+lognum4;
System.out.println("2016-12-3 to 2016-12-4 login user number except same userid: "+lognumexceptsameuser);
System.out.println("2016-12-3 to 2016-12-4 login user number: "+logtotalnum);


输出:


2016-12-3  login user number: 4
2016-12-4  login user number: 3
2016-12-3 to 2016-12-4 login user number except same userid: 6
2016-12-3 to 2016-12-4 login user number: 7

如果用户数登录求和时,不同日期的用户ID登录需要计算,那么就不要做或操作,将每天的登录数求和即可。
如果求的是一个月内,用户登录总数,用户登录多次只算一次的话,只需要将这段时间内的bit进行或操作即可。

确实快,不需要你记录到数据库。只需要一个bit就能记录该用户登录。

利用了redis本身用内存存储的优势。这种需求下的解决方案确实是快,方便。

当然这种只针对这种特殊的需求,你非要每天用户重复登录的次数也算进去,当然就不能用这种方法。所以,针对不同的需求,找出最优方案才是最好的。
--------------------- 

转载自:https://blog.csdn.net/iaiti/article/details/53446667

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值