Redis Scan 原理解析与注意点

一、 概述
由于 Redis 是单线程在处理用户的命令,而 Keys 命令会一次性遍历所有 Key,于是在 命令执行过程中,无法执行其他命令。这就导致如果 Redis 中的 key 比较多,那么 Keys 命令执行时间就会比较长,从而阻塞 Redis。
所以很多教程都推荐使用 Scan 命令来代替 Keys,因为 Scan 可以限制每次遍历的 key 数量。

Keys 的缺点:
1)没有limit,我们只能一次性获取所有符合条件的key,如果结果有上百万条,那么等待你的就是“无穷无尽”的字符串输出。
2)keys命令是遍历算法,时间复杂度是O(N)。如我们刚才所说,这个命令非常容易导致Redis服务卡顿。因此,我们要尽量避免在生产环境使用该命令。
相比于keys命令,Scan命令有两个比较明显的优势:
1)Scan命令的时间复杂度虽然也是O(N),但它是分次进行的,不会阻塞线程。
2)Scan命令提供了 count 参数,可以控制每次遍历的集合数。

可以理解为 Scan 是渐进式的 Keys。

Scan 命令语法如下:

SCAN cursor [MATCH pattern] [COUNT count]
  • cursor - 游标。
  • pattern - 匹配的模式。
  • count - 指定每次遍历多少个集合。
  1. 可以简单理解为每次遍历多少个元素
  2. 根据测试,推荐 Count大小为 1W。

Scan 返回值为数组,会返回一个游标+一系列的 Key
大致用法如下:
SCAN命令是基于游标的,每次调用后,都会返回一个游标,用于下一次迭代。当游标返回0时,表示迭代结束。

第一次 Scan 时指定游标为 0,表示开启新的一轮迭代,然后 Scan 命令返回一个新的游标,作为第二次 Scan 时的游标值继续迭代,一直到 Scan 返回游标为0,表示本轮迭代结束。

通过这个就可以看出,Scan 完成一次迭代,需要和 Redis 进行多次交互。

Scan原理
Redis使用了Hash表作为底层实现,原因不外乎高效且实现简单。类似于HashMap那样数组+链表的结构。其中第一维的数组大小为2n(n>=0)。每次扩容数组长度扩大一倍。
Scan命令就是对这个一维数组进行遍历。每次返回的游标值也都是这个数组的索引。Count 参数表示遍历多少个数组的元素,将这些元素下挂接的符合条件的结果都返回。因为每个元素下挂接的链表大小不同,所以每次返回的结果数量也就不同。


Scan 命令注意事项

  • 返回的结果可能会有重复,需要客户端去重复,这点非常重要;
  • 遍历的过程中如果有数据修改,改动后的数据能不能遍历到是不确定的;
  • 单次返回的结果是空的并不意味着遍历结束,而要看返回的游标值是否为零;

二、 Scan 踩坑
使用时遇到一个 特殊场景,跨区域远程连接 Redis 并进行模糊查询,扫描所有指定前缀的 Key。
最开始也没多想,直接就是开始 Scan,然后 Count 参数指定的是 1000。

Redis 中大概几百万 Key,最后发现这个接口需要几十上百秒才返回。
什么原因呢?
Scan 命令中的 Count 指定一次扫描多少 Key,这里指定为 1000,几百万Key就需要几千次迭代,即和 Redis 交互几千次,然后因为是远程连接,网络延迟比较大,所以耗时特别长。
最后将 Count 参数调大后,减少了交互次数,就好多了。Count 参数越大,Redis 阻塞时间也会越长,需要取舍。极限一点,Count 参数和总 Key 数一致时,Scan 命令就和 Keys 效果一样了。
Count 大小和 Scan 总耗时的关系如下图:

可以发现 Count 越大,总耗时就越短,不过越后面提升就越不明显了。所以推荐的 Count 大小为 1W 左右。
如果不考虑 Redis 的阻塞,其实 Keys 比 Scan 会快很多,毕竟一次性处理,省去了多余的交互。

 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: Redis Scan 是 Redis 中的一个命令,用于迭代获取数据库中的键。它的作用类似于其他数据库中的 SELECT 命令。 你可以使用 Redis Scan 命令来获取特定类型的键、匹配特定模式的键、按照字典序排序的键等。 使用方法: ``` SCAN cursor [MATCH pattern] [COUNT count] ``` 参数说明: - cursor:游标,用于记录扫描进度。 - pattern:可选参数,用于匹配键的模式。 - count:可选参数,指定每次迭代返回的键的数量。 例如,你可以使用以下命令来获取所有以 "user:" 开头的键: ``` SCAN 0 MATCH user:* ``` 注意Redis Scan 命令不能保证返回的键是按照字典序排序的,因此在使用时需要注意。 ### 回答2: Redis的SCAN命令用于迭代数据库中的key集合,它通过遍历数据库来获取匹配指定模式的全部key。由于Redis是单线程操作的,如果在一个请求中执行SCAN命令时,数据库发生了对key的增删操作,可能会导致某些key被遍历不到或者重复遍历,为了解决这个问题,可以使用游标(cursor)参数进行分段遍历。 SCAN命令的基本使用格式为:SCAN cursor [MATCH pattern] [COUNT count]。其中,cursor代表游标的起始位置,初始值为0;MATCH参数用于指定要匹配的key的模式,默认为不进行匹配;COUNT参数用于指定每次遍历返回的元素个数,默认值为10。 执行SCAN命令后,Redis会返回一个包含两部分信息的列表,第一部分是当前游标的值,用于下一次迭代时作为参数传入SCAN命令中;第二部分是匹配模式下的key列表。 通过连续执行SCAN命令,并将上一次命令返回的游标值作为下一次命令的参数,可以逐步遍历整个数据库中的所有key。但需要注意的是,由于SCAN命令是基于迭代器实现的,所以可能会有一些key被遗漏或重复遍历的情况发生。 使用SCAN命令可以避免在业务中使用KEYS命令带来的性能问题。在大数据量场景下,KEYS命令会导致Redis阻塞,直到遍历完全部key集合。而使用SCAN命令可以通过分段遍历的方式,减少了阻塞时间,可以更好地保证Redis的性能和稳定性。 总之,SCAN命令是一种高效且可靠的遍历Redis数据库中key的方法,通过游标参数的配合,可以有效地获取匹配指定模式的全部key。 ### 回答3: Redis Scan 是 Redis 提供的一个命令,用于遍历数据库中的所有键。 在 Redis 中,键值对是以键值对方式存储的,而键是用来唯一标识一个值的字符串。Redis Scan 命令可以遍历数据库中的所有键,用于查找满足指定模式的键。它的语法是: ``` scan cursor [MATCH pattern] [COUNT count] ``` 其中,`cursor` 是一个游标,表示遍历的起始位置,一般可以设置为0以开始遍历;`MATCH pattern` 是一个可选参数,用于指定匹配的模式,只返回匹配模式的键;`COUNT count` 是一个可选参数,用于指定每次遍历返回的键的数量,默认值是10。 使用 Redis Scan 可以灵活地遍历数据库中的键值对,而无需事先知道具体的键的名称。它可以用于实现一些功能,比如获取指定前缀的所有键值对、分页查询等。 需要注意的是,Redis Scan 是一个迭代器,它通过游标来遍历数据库,每次返回一部分键。当返回结果中的游标值为0时,表示遍历完成。为了获取所有的键,需要多次调用 Redis Scan 命令,直到返回结果中的游标值为0为止。 使用 Redis Scan 是一个高效的遍历数据库的方式,可以减少对服务器的压力,特别是在数据量较大时。但由于它是一个近似值的遍历方式,返回结果中可能包含一些已经被删除的键,需要在客户端进行二次过滤。 总之,Redis Scan 是一个非常有用的命令,可以灵活地遍历数据库中的键值对,提供了方便的方法来查找满足指定模式的键。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值