标题被我写的夸张了点。不过里面的内容确实是可以实现这样的东西。
通过《The Little Redis Book》看到有这样一篇博文《REDIS BITMAPS – FAST, EASY, REALTIME METRICS》,这次就不翻译了,已经有其他中文的版本。写这个目的在于一开始没看懂,想把整个详细的思想写出来。
先看setbit的使用。https://redis.io/commands/setbit。
先说位图,bitmap,根据二进制不同位置的值即可表示其代表的值。这就让我想起了上过的数字图像处理了。
setbit(key,offset,value)
offset是从左往右算的位数,从零开始,即高位往低位的值,例如100011,offset为0的时候值为1,4和5的值都为1。
本身redis存储字符串,以二进制格式存储。
所以文章里面的配图是错的。反过来了。
返回值是0和1,表示的是,设置前该offset位置下bit的值。
The offset argument is required to be greater than or equal to 0, and smaller than 2^32 (this limits bitmaps to 512MB)
bitmap本身offset的限制就是0到2^32,内存限制为521MB,分配所需时间才几百ms,刚刚好是2^32个bit,也就是4294967296,也就是说,offset最大能去到4294967296-1去。有四十二亿。
照着文章作者的思路。他们网站封顶有1亿多的用户。每个用户都有自己的用户ID。一个用户做操作,我们有个40多亿长度全为0的位图。
我们只需要在这个根据ID做位置定位将其改为1,就算记录了该用户的操作了。
而要统计一天用多少用户做操作(为什么说操作不说登录了,因为不仅仅限于登录,浏览某某东西,写日记等等都可以用这种方法)
,除去重复,总数就是这个位图里面值为1的个数。
将文章的代码具体实现了一下。
Jedis j = new Jedis("localhost");
//auth password
j.auth("myredis");
//2016-12-3 login operation user
j.setbit("login:2016-12-3".getBytes(), 1, true);
j.setbit("login:2016-12-3".getBytes(), 124431, true);
j.setbit("login:2016-12-3".getBytes(),1231, true);
j.setbit("login:2016-12-3".getBytes(), 323121, true);
BitSet b = BitSet.valueOf(j.get("login:2016-12-3".getBytes()));
//the number of bit value 1
int lognum3 = b.cardinality();
System.out.println("2016-12-3 login user number: "+lognum3);
//2016-12-3 login operation user
j.setbit("login:2016-12-4".getBytes(), 1, true);
j.setbit("login:2016-12-4".getBytes(), 1231231, true);
j.setbit("login:2016-12-4".getBytes(), 334441, true);
BitSet b2 = BitSet.valueOf(j.get("login:2016-12-4".getBytes()));
int lognum4 = b2.cardinality();
System.out.println("2016-12-4 login user number: "+b2.cardinality());
b.or(b2);
//or操作之后 同样userid的记录会重合不做记录,所以具体的数据统计看自己的需求而定
int lognumexceptsameuser = b.cardinality();
int logtotalnum = lognum3+lognum4;
System.out.println("2016-12-3 to 2016-12-4 login user number except same userid: "+lognumexceptsameuser);
System.out.println("2016-12-3 to 2016-12-4 login user number: "+logtotalnum);
输出:
2016-12-3 login user number: 4
2016-12-4 login user number: 3
2016-12-3 to 2016-12-4 login user number except same userid: 6
2016-12-3 to 2016-12-4 login user number: 7
如果用户数登录求和时,不同日期的用户ID登录需要计算,那么就不要做或操作,将每天的登录数求和即可。
如果求的是一个月内,用户登录总数,用户登录多次只算一次的话,只需要将这段时间内的bit进行或操作即可。
确实快,不需要你记录到数据库。只需要一个bit就能记录该用户登录。
利用了redis本身用内存存储的优势。这种需求下的解决方案确实是快,方便。
当然这种只针对这种特殊的需求,你非要每天用户重复登录的次数也算进去,当然就不能用这种方法。所以,针对不同的需求,找出最优方案才是最好的。