rehash
- redis哈希表结构 使用链地址方法来解决键冲突的,冲突后追加到链表后面。
- redis中有两个哈希表,其中一个时正常使用的 ht[0],另一个是在扩容或者收缩时才需要的ht[1],一般为空
- redis中的哈希表也是有 负载因子的负载因子 = 哈希表已保存节点数量 / 哈希表大小(桶的数量) load factor = ht[0].used / ht[0].size
- redis扩容时机:1. 服务器未执行BGSAVE / BAREWRITEAOF 时,哈希表的负载因子 >= 1 2 . 服务器正在执行BGSAVE / BAREWRITEAOF 时,哈希表的负载因子 >= 5 3 . 当负载因子小于 0.1时,执行收缩
- redis扩容,收缩大小 扩容:ht[1]大小为 >= ht[0].used * 2 的 2^n 收缩:ht[1]大小为 >= ht[0].used 的 2^n
扩容步骤
- 先将保存在ht[0]中的所有键值对 rehash到ht[1]中:rehash就是重新计算key的hash值和索引值,然后将键值对放置到ht[1]哈希表的指定位置上
- 当ht[0]包含的所有键值对都迁移到了ht[1]后(ht[0]变为空表),释放ht[0],将ht[1]设置为ht[0],并将ht[1]新建一个空白哈希表,为下一次rehash做准备。
总结
Redis的rehash动作是一个内存管理和数据管理的一个核心操作,因为Redis主要使用单线程做数据管理和消息效应。它的rehash数据迁移过程採用的是渐进式的数据迁移模式。这样做是为了防止rehash过程太长阻塞数据处理线程。
并没有採用memcached的多线程迁移模式。关于memcached的rehash过程,以后再做介绍。
从redis的rehash过程设计的非常巧,也非常优雅。在这里值得注意的是,redis在find数据的时候,是同一时候查找正在迁移的ht[0]和被迁移的ht[1]。防止迁移过程数据命不中的问题。