前言
不知你大规模的用过Redis
吗?还是仅仅作为缓存的工具了?在Redis中使用最多的就是集合了,举个例子,如下场景:
- 签到系统中,一天对应一系列的用户签到记录。
- 电商系统中,一个商品对应一系列的评论。
- 交友系统中,某个用户的一系列的好友。
Redis中集合的特点无非是一个Key
对应一系列的数据, 但是数据的作用往往是为了统计的,比如:
- 交友系统中,需要统计每天的新增好友,以及双方的共同好友。
- 电商系统中,需要统计评论列表中的最新评论。
- 签到系统中,需要统计连续一个月的签到的用户数量。
大型互联网应用中,数据量是巨大的,少说百万,千万,甚至是一个亿,比如电商巨头淘宝,交友巨头微信、微博;办公巨头钉钉等,哪一个的用户不是上亿?
只有针对不同场景,选择合适的集合,统计才能更方便。
聚合统计
聚合统计
指的是多个元素聚合的结果,比如统计多个集合的交集、并集、差集
在你需要对多个集合做聚合统计的时候,Set集合是个不错的选择,除了其中无重复的数据外,Redis还提供了对应的API
交集
在上述的例子中交友系统中统计双方的共同好友正是聚合统计中的交集
。
在Redis
中可以userid
作为key
,好友的userid
作为value
,如下图:
统计两个用户的共同好友只需要两个Set
集合的交集,命令如下;
SINTERSTORE userid:new userid:20002 userid:20003
复制代码
上述命令运行完成后,userid:new
这个key中存储的将是userid:20002
、userid:20003
两个集合的交集。
差集
举个例子:假设交友系统中需要统计每日新增的好友,此时就需要对临近两天的好友集合取差集了,比如2020/11/1</