Redis 实战篇：巧用Bitmap 实现亿级海量数据统计

最新推荐文章于 2025-03-14 10:20:17 发布

原创

最新推荐文章于 2025-03-14 10:20:17 发布 · 776 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#redis #java #前端

假如我们在判断用户是否登陆的场景中使用 Redis 的 String 类型实现（key -> userId，value -> 0 表示下线，1 - 登陆），假如存储 100 万个用户的登陆状态，如果以字符串的形式存储，就需要存储 100 万个字符串了，内存开销太大。

码哥，为什么 String 类型内存开销大？

String 类型除了记录实际数据以外，还需要额外的内存记录数据长度、空间使用等信息。

当保存的数据包含字符串，String 类型就使用简单动态字符串（SDS）结构体来保存，如下图所示：

SDS

len：占 4 个字节，表示 buf 的已用长度。
alloc：占 4 个字节，表示 buf 实际分配的长度，通常 > len。
buf：字节数组，保存实际的数据，Redis 自动在数组最后加上一个 “\0”，额外占用一个字节的开销。

所以，在 SDS 中除了 buf 保存实际的数据， len 与 alloc 就是额外的开销。

另外，还有一个 RedisObject 结构的开销，因为 Redis 的数据类型有很多，而且，不同数据类型都有些相同的元数据要记录（比如最后一次访问的时间、被引用的次数等）。

所以，Redis 会用一个 RedisObject 结构体来统一记录这些元数据，同时指向实际数据。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

2401_83916030

关注关注

22
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

第十六章_Redis案例落地实战bitmap/hyperloglog/GEO

sinat_31583645的博客

05-17

559

截至2020年3月31日的12个月，京东年度活跃用户数3.87亿，同比增长24.8%，环比增长超2500万，此外，2020年3月移动端日均活跃用户数同比增长46%假设10%左右的用户参与签到，签到用户也高达3千万。2 一个月最多31天，刚好我们的int类型是32位，那这样一个int类型就可以搞定一个月，32位大于31天，当天来了位是1没来就是0。距离的单位和用户给定的范围单位保持一致。georadius 以给定的经纬度为中心，返回键包含的位置元素当中，与中心的距离不超过给定最大距离的所有位置元素。

Bitmap 实现当前在线用户数量

学无止境

04-12

2040

Bitmap是Redis中的一种数据结构，它是一个类似于位数组的数据结构，用于处理位数据。在Redis中，Bitmap是使用字符串来存储的，一个Byte可以存储8个二进制位，一个字符串可以存储2个二进制位，所以一个字符串最多可以表示2个用户的在线状态, 也就是它的偏移量offset。在实际应用中，Bitmap常用于记录某个ID是否存在、统计某个时间段内的用户在线情况等等。通过对Bitmap进行位运算，可以快速高效地完成这些操作。

参与评论您还未登录，请先登录后发表或查看评论

Redis实战——签到统计（BitMap的用法）

qq_59212867的博客

12-20

2837

Redis实战——签到统计 BitMap的用法及实战

bitMap原理及实战

LJJZJ的博客

12-13

775

小知识在实际项目中，我们经常需要聚合统计，比如统计一个年龄在20-30，喜欢看技术书籍，喜欢听音乐，喜欢宅在家的程序员等等一系列标签的用户。如果使用mysql求并集，首先语句随着标签变长而变长，其次聚合，分组，去重严重影响语句性能。这种情况如何解决？比如现在比较火的面试题，在10亿整数中找出100个重复的数，或者任意给定一个整数，判断是否在这个10亿数中。 bitMap原理 bitMap...

BitMap的小实践

ooeeerrtt的博客

04-28

946

一、需求场景每天大量数据入库，但是90%以上的数据都是主键冲突的，如果主键冲突则跳过，如果不冲突则写入。比较简单的逻辑是，每来一条数据就在表里查询一下主键是否已经存在，如果存在跳过，如果不存在写入。但是这样的情况会导致大量的数据库查询操作，因此采用在内存中构建一个bitmap，通过bitmap判断数据是否需要写入，从而避免大量的低价值的查询操作。二、BitMap代码 class BitMap(object): def __init__(self,m...

Redis 实战篇：巧用Bitmap 实现亿级海量数据统计，javanginx面试题

m0_60732644的博客

03-29

996

这就是 Bitmap 的优势。判断用户登陆态怎么用 Bitmap 来判断海量用户中某个用户是否在线呢？Bitmap 提供了操作，通过一个偏移值 offset 对 bit 数组的 offset 位置的 bit 位进行读写操作，需要注意的是 offset 从 0 开始。只需要一个 key = login_status 表示存储用户登陆状态集合数据，将用户 ID 作为 offset，在线就设置为 1，下线设置 0。通过GETBIT判断对应的用户是否在线。50000 万用户只需要 6 MB 的空间。

《Redis 进阶：Stream、Bitmap、Bitfield 实战》

热门推荐

寒泉

06-23

6万+

Redis 常用命令、数据类型查看帮助 To get help about Redis commands type: "help @<group>" to get a list of commands in <group> "help <command>" for help on <command> "help <tab>" to get a list of possible help topics

Redis Bitmap 的强大魅力与实践应用

m0_57836225的博客

10-25

388

如果没有参加，设置为 0。- 在操作系统和编程语言的内存管理中，Bitmap 可以用于表示内存的分配状态。- 例如，要检查某个学生是否参加了活动，只需要查看对应的位的值即可，这个操作非常快速。同时，可以快速地对多个位进行逻辑运算，如与、或、非等，以实现复杂的查询和操作。- 例如，如果要表示 1000 万个整数是否存在，使用传统的数组可能需要占用大量的内存，而使用 Bitmap 可能只需要占用几兆字节的内存。- 例如，在 Java 的垃圾回收机制中，就使用了类似的技术来跟踪对象的分配和回收情况。

bitmap进行个数统计

dingcunfen9081的博客

08-24

916

昨天看了编程珠玑第一章的内容, 发现bitmap对于统计某一个范围内的整数个数效率很高, 就自己实现了一下: 这是原始的bitmap, 用于统计0~maxSize是否出现, 也可以用于排序 3 public class BitMap 4 { 5 private int[] arr ; 6 private final int mask = 0X1F ;...

Redis数据结构Bitmap实战之用户签到

竹林幽深

01-08

446

https://blog.csdn.net/qq_45740561/article/details/123227903

用bitmap解决海量电话号码统计问题

u013322907的专栏

07-25

3538

原文：http://blog.csdn.net/chris820313/article/details/6795561 为准备某几个大公司的笔试，看到这样一个问题：已知某个文件内包含一些电话号码，每个号码为8位数字，统计不同号码的个数。我所拜读的材料里提到了用bitmap解决这种问题，也就是说：每一个电话号码被映射到了不同的位。例如： 6123456

8-Redis 实战篇：巧用 Bitmap 实现亿级海量数据统计码哥

有才而性缓，定属大才。有智而气和，斯为大智。

07-05

279

在移动应用的业务场景中，我们需要保存这样的信息：一个 key 关联了一个数据集合。常见的场景如下：给一个 userId ，判断用户登陆状态；显示用户某个月的签到次数和首次签到时间；两亿用户最近 7 天的签到情况，统计 7 天内连续签到的用户总数；通常情况下，我们面临的用户数量以及访问量都是巨大的，比如百万、千万级别的用户数量，或者千万级别、甚至亿级别的访问信息。所以，我们必须要选择能够非常高效地统计大量数据（例如亿级）的集合类型。如何选择合适的数据集合，我们

Redis的Bitmap的使用案例与场景

weixin_43979411的博客

01-18

1332

【代码】Redis的Bitmap的使用案例与场景。

巧用 Bitmap 实现亿级海量数据统计

CSDN云计算

06-29

715

作者 | 码哥字节来源 | 码哥字节在移动应用的业务场景中，我们需要保存这样的信息：一个 key 关联了一个数据集合。常见的场景如下：给一个 userId ，判断用户登陆状态；显示用户某个月的签到次数和首次签到时间；两亿用户最近 7 天的签到情况，统计 7 天内连续签到的用户总数；通常情况下，我们面临的用户数量以及访问量都是巨大的，比如百万、千万级别的用户数量，或者千万级...

深入探索Android Bitmap：从原理到实战

顾林海

03-14

2131

Bitmap 在 Android 开发中占据着举足轻重的地位，作为图片在内存中的呈现形式，它为开发者提供了强大的图像操作能力。从原理上看，Bitmap 通过像素点集合存储图像信息，其颜色通道和内存占用的计算方式决定了图像的显示效果和内存开销。在实际应用中，我们需要根据不同的需求选择合适的创建和加载方式，并且要注意优化性能，避免内存溢出等问题。通过本文的介绍，我们深入了解了 Bitmap 的内部原理，包括颜色通道的存储方式和内存占用的计算方法。

大数据量统计神器bitmap详解

weixin_30477293的博客

12-05

321

　　bitmap就是使用bit位来标识数据，一个bit具有两个值：0和1，正好可以标识true和false，8个bit组成一个byte，当统计大数据量数字集时具有运算快速，节省空间的优势　　应用场景：　　标识统计用户签到：　　　　一般情况下，用户id都是自增的数字主键，当数百万数千万用户量时，可以结合redis来快速标识统计，redis指令：SETBIT key offset valu...

BitMap的简单实现

三方

01-12

788

Bitmap介绍 bitmap是很有用的结构。所谓的bitmap就是用一个bit位来标记某个元素，而数组下标是该元素。 bitmap优势 bitmap经常用在大数据的题中，比如10亿个int类型的数，如果用int数组存储的话，那么需要大约4G内存，浪费内存。如果用bitmap解决，就比较方便。bitmap可以用int来模拟，也可以用byte来模拟，它只是逻辑上的概念，在java语言中写不出来...