【原理】scan

最新推荐文章于 2023-01-07 16:07:27 发布

weixin_30920597

最新推荐文章于 2023-01-07 16:07:27 发布

阅读量286

点赞数

文章标签：数据库

原文链接：http://www.cnblogs.com/itplay/p/11157033.html

版权

SCAN 命令的保证（guarantees）

同一个元素可能会被返回多次。处理重复元素的工作交由应用程序负责，比如说，可以考虑将迭代返回的元素仅仅用于可以安全地重复执行多次的操作上。
如果一个元素是在迭代过程中被添加到数据集的，又或者是在迭代过程中从数据集中被删除的，那么这个元素可能会被返回，也可能不会，这是未定义的（undefined）。

顺序迭代缺点：

　　1.如果后来字典扩容了，比如2,4倍长度，那么能够保证一定能找出没变化的key，但是却会出现大量重复。

　　　　比如当前的key数组大小是8，后来变为16了，比如从0,1,2,3````顺序扫描，如果数组发生扩容，那么前面的0,1,2,3 slot里面的数据会发生一部分迁移到对应的8,9,10,11 slot里面去，并且这个量挺大；

　　2.如果字典缩小了，比如从16缩小到8，原先scan已经遍历了0,1,2,3 ，然后发生缩小，这样后来迭代停止在7号slot，但是8,9,10,11这几个slot的数据会分别合并到0,1,2,3里面去，从而scan就没有扫描出这部分元素出来，无法保证可用性；

　　3.在发生rehashing的过程中，这个肯定有问题的。

redis的反向二进制位迭代器原理：

首先从直观感觉上，跟第二种方法类似的跳跃扫描，但是redis的方法更加完善。下面一步步的来介绍一下redis的SCAN原理

首先我们知道，这个迭代操作有下面几个地方需要注意：

字典大小不变的时候；
字典大小扩容的时候；
字典大小缩小的时候；
发生rehash的时候；

假设字典大小为16，那么redis 的slot扫描顺序为：

可以两两分组，并且互相相差正好是16/2= 8

其二进制位的变化，如下，可以看出其两两的差异在于高位不一样，算法会依次从高位开始尝试0和1的变化

依次从高位（有效位）开始，不断尝试将当前高位设置为1，然后变动更高位为不同组合，以此来扫描整个字典数组。

这里我们肯定是一定能够扫描完整个数组的，不会漏。但其最大的好处在于，从高位扫描的时候，扫描的临近的2个元素都是相关的就是说同模的，比如0%4 == 4%4， 1%4 == 5%1 ，因此想到其实hash的时候，跟模是很相关的。

比如当整个字典大小只有4的时候，一个元素计算出的整数为5，那么计算他的hash值需要模4，也就是hash(n) == 5%4 == 1 , 元素存放在第1个槽位中。当字典扩容的时候，字典大小变为8，此时计算hash的时候为5%8 == 5 ，该元素从1号slot迁移到了5号，1和5是对应的，我们称之为同模或者对应。同模的槽位的元素最容易出现合并或者拆分了。因此在迭代的时候需要及时的扫描这些相关的槽位，这样就不会造成大面积的重复扫描。

转自：http://chenzhenianqing.com/articles/1101.html

转载于:https://www.cnblogs.com/itplay/p/11157033.html

weixin_30920597

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。