Redis:应用实践之集合的统计

【关于作者】

关于作者,目前在蚂蚁金服搬砖任职,在支付宝营销投放领域工作了多年,目前在专注于内存数据库相关的应用学习,如果你有任何技术交流或大厂内推及面试咨询,都可以从我的个人博客(https://0522-isniceday.top/)联系我

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Bq0sTLOj-1680957245062)(https://zhangyuxiangplus.oss-cn-hangzhou.aliyuncs.com/boke/统计场景.png)]

1.聚合统计

1.1.概念:

统计多个集合元素的聚合结果,集合之间的交集(公有)、并集(全部)、差集(独有)等

利用Set结构的聚合API进行聚合

2.排序统计

排序需要有序,两种有序结构:List和Zset、List是根据插入元素的顺序保证有序,而List是依据评分进行排序,评分可以再插入时候手动指定

需要展示最新列表、排行榜等场景时,如果数据更新频繁或者需要分页显示,建议你优先考虑使用Sorted Set

3.二值状态统计

3.1概念:

二值状态是指集合元素的取值只有0和1两种状态

3.2.Bitmap:

3.2.1.概念

String类型作为底层数据结构的一种统计二值类型的数据类型。String类型会保存为二进制数组,所以Redis把字节数组的每个bit位利用开来,bitmap实际就是一个bit数组

3.2.2.操作

bitmap提供了GETBIT/SETBIT,使用偏移量offset来对bit数组进行读写。offset从0开始计数,对bit位置进行写操作时该bit位会被设置为1,BITCOUNT操作会统计1的数量

Bitmap支持用BITOP命令对多个Bitmap按位做“与”“或”“异或”的操作,操作的结果会保存到一个新的Bitmap中。

所以,如果只需要统计数据的二值状态,例如商品有没有、用户在不在等,就可以使用Bitmap,因为它只用一个bit位就能表示0或1。在记录海量数据时,Bitmap能够有效地节省内存空间。

4.基数统计

4.1.概念:

基数统计就是统计一个元素中不重复的元素个数,例如统计网页UV(uv是unique visitor的简写,是指通过互联网访问、浏览这个网页的自然人,统计人数)

4.2.HyperLogLog

4.2.1.概念:

用于统计基数的数据集合类型,最大优势在于元素数量非常多的时候,它计算基数的空间总是固定的,而且很小

在Redis中,每个 HyperLogLog只需要花费 12 KB 内存,就可以计算接近 2^64 个元素的基数。你看,和元素越多就越耗费内存的Set和Hash类型相比,HyperLogLog就非常节省空间

不过,有一点需要你注意一下,HyperLogLog的统计规则是基于概率完成的,所以它给出的统计结果是有一定误差的,标准误算率是0.81%。这也就意味着,你使用HyperLogLog统计的UV是100万,但实际的UV可能是101万。虽然误差率不算大,但是,如果你需要精确统计结果的话,最好还是继续用Set或Hash类型。

img

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

哈哈哈张大侠

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值