2024年Redis实战应用——位图和HyperLogLog详解，夯实基础再前行，Java理论知识

2401_84585339

于 2024-05-06 22:20:14 发布

阅读量670

点赞数 7

分类专栏：程序员文章标签： redis java 数据库

本文链接：https://blog.csdn.net/2401_84585339/article/details/138510448

版权

程序员专栏收录该内容

118 篇文章 0 订阅

订阅专栏

最后

作为过来人，小编是整理了很多进阶架构视频资料、面试文档以及PDF的学习资料，针对上面一套系统大纲小编也有对应的相关进阶架构视频资料

本文已被CODING开源项目：【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

需要这份系统化的资料的朋友，可以点击这里获取

127.0.0.1:6379> setbit x 1 1

(integer) 0

127.0.0.1:6379> get x

“\xc0”

统计和查找

Redis 提供了位图统计指令 bitcount 和位图查找指令 bitpos，bitcount 用来统计指定位置范围内 1 的个数，bitpos 用来查找指定范围内出现的第一个 0 或 1。

比如我们可以通过 bitcount 统计用户一共签到了多少天，通过 bitpos 指令查找用户从哪一天开始第一次签到。如果指定了范围参数[start, end]，就可以统计在某个时间范围内用户签到了多少天，用户自某天以后的哪天开始签到。

遗憾的是， start 和 end 参数是字节索引，也就是说指定的位范围必须是 8 的倍数，而不能任意指定。这很奇怪，我表示不是很能理解 Antirez 为什么要这样设计。因为这个设计，我们无法直接计算某个月内用户签到了多少天，而必须要将这个月所覆盖的字节内容全部取出来 (getrange 可以取出字符串的子串) 然后在内存里进行统计，这个非常繁琐。

接下来我们简单试用一下 bitcount 指令和 bitpos 指令：

127.0.0.1:6379> set w hello

127.0.0.1:6379> bitcount w

(integer) 21

127.0.0.1:6379> bitcount w 0 0 # 第一个字符中 1 的位数

(integer) 3

127.0.0.1:6379> bitcount w 0 1 # 前两个字符中 1 的位数

(integer) 7

127.0.0.1:6379> bitpos w 0 # 第一个 0 位

(integer) 0

127.0.0.1:6379> bitpos w 1 # 第一个 1 位

(integer) 1

127.0.0.1:6379> bitpos w 1 1 1 # 从第二个字符算起，第一个 1 位

(integer) 9

127.0.0.1:6379> bitpos w 1 2 2 # 从第三个字符算起，第一个 1 位

(integer) 17

魔术指令 bitfield

前文我们设置 (setbit) 和获取 (getbit) 指定位的值都是单个位的，如果要一次操作多个位，就必须使用管道来处理。不过 Redis 的 3.2 版本以后新增了一个功能强大的指令，有了这条指令，不用管道也可以一次进行多个位的操作。 bitfield 有三个子指令，分别是 get/set/incrby，它们都可以对指定位片段进行读写，但是最多只能处理 64 个连续的位，如果超过 64 位，就得使用多个子指令，bitfield 可以一次执行多个子指令。

Redis实战应用——位图和HyperLogLog详解，夯实基础再前行

127.0.0.1:6379> set w hello

127.0.0.1:6379> bitfield w get u4 0 # 从第一个位开始取 4 个位，结果是无符号数 (u)

(integer) 6

127.0.0.1:6379> bitfield w get u3 2 # 从第三个位开始取 3 个位，结果是无符号数 (u)

(integer) 5

127.0.0.1:6379> bitfield w get i4 0 # 从第一个位开始取 4 个位，结果是有符号数 (i)

(integer) 6

127.0.0.1:6379> bitfield w get i3 2 # 从第三个位开始取 3 个位，结果是有符号数 (i)

(integer) -3

所谓有符号数是指获取的位数组中第一个位是符号位，剩下的才是值。如果第一位是 1，那就是负数。无符号数表示非负数，没有符号位，获取的位数组全部都是值。有符号数最多可以获取 64 位，无符号数只能获取 63 位 (因为 Redis 协议中的 integer 是有符号数，最大 64 位，不能传递 64 位无符号值)。如果超出位数限制，Redis 就会告诉你参数错误。

接下来我们一次执行多个子指令：

127.0.0.1:6379> bitfield w get u4 0 get u3 2 get i4 0 get i3 2

(integer) 6
(integer) 5
(integer) 6
(integer) -3

wow，很魔法有没有！

然后我们使用 set 子指令将第二个字符 e 改成 a，a 的 ASCII 码是 97。

127.0.0.1:6379> bitfield w set u8 8 97 # 从第 8 个位开始，将接下来的 8 个位用无符号数 97 替换

(integer) 101

127.0.0.1:6379> get w

“hallo”

再看第三个子指令 incrby，它用来对指定范围的位进行自增操作。既然提到自增，就有可能出现溢出。如果增加了正数，会出现上溢，如果增加的是负数，就会出现下溢出。Redis 默认的处理是折返。如果出现了溢出，就将溢出的符号位丢掉。如果是 8 位无符号数 255，加 1 后就会溢出，会全部变零。如果是 8 位有符号数 127，加 1 后就会溢出变成 -128。接下来我们实践一下这个子指令 incrby ：

127.0.0.1:6379> set w hello

127.0.0.1:6379> bitfield w incrby u4 2 1 # 从第三个位开始，对接下来的 4 位无符号数 +1

(integer) 11

127.0.0.1:6379> bitfield w incrby u4 2 1

(integer) 12

127.0.0.1:6379> bitfield w incrby u4 2 1

(integer) 13

127.0.0.1:6379> bitfield w incrby u4 2 1

(integer) 14

127.0.0.1:6379> bitfield w incrby u4 2 1

(integer) 15

127.0.0.1:6379> bitfield w incrby u4 2 1 # 溢出折返了

(integer) 0

bitfield 指令提供了溢出策略子指令 overflow，用户可以选择溢出行为，默认是折返 (wrap)，还可以选择失败 (fail) 报错不执行，以及饱和截断 (sat)，超过了范围就停留在最大最小值。overflow 指令只影响接下来的第一条指令，这条指令执行完后溢出策略会变成默认值折返 (wrap)。

接下来我们分别试试这两个策略的行为

饱和截断 SAT

127.0.0.1:6379> set w hello