在Redis中,字典主要由两张哈希表组成,哈希表主要由哈希节点组成。
字典的源码:
哈希表的源码 :
哈希节点源码:
字典表的结构:
头插法添加键值对
每一个添加的键值对都会对key先进行哈希算法计算,算出哈希值,根据哈希值分配哈希数组的位置,如果该位置已存有别的key,则这种情况称为键冲突,也叫哈希冲突。Redis中,使用链地址法解决键冲突,新加入的节点放在链表的头位置,这种方法也叫头插法。
rehash(重新散列)
当哈希表的负载因子太高或太低时,程序会通过rehash对哈希表进行扩展或收缩操作。
哈希表扩容/收缩的条件如下:
(1)服务器没有在执行BGSAVE命令或BGREWRITEAOF命令,并且哈希表负载因子>=1,会执行扩容操作。
(2)服务器正在执行BGSAVE命令或BGREWRITEAOF命令,并且哈希表负载因子>=5,会执行扩容操作。
(3)当哈希表负载因子<0.1,会执行收缩操作。
哈希表扩容/收缩的步骤如下:
(1)为ht[1]哈希表分配空间。如果是扩展操作,分配的空间大小为 >=ht[0].used*2的第一个2^n(2的幂次方);如果是收缩操作分配的空间大小为 >=ht[0].used的第一个2^n(2的幂次方)。这里有个知识点,哈希表收缩或扩展之后的大小都是2^n,这是为了在rehash可以通过位运算就计算出新的位置,提高效率。
(2)将ht[0]的所以键rehash算出新的哈希值和索引值,把键值对移到ht[1]上。
(3)当所有的键值对都迁移完毕后,释放ht[0],将ht[1]设置为ht[0],并创建新的空白的ht[1],为下一次rehash做准备。
渐进式rehash
渐进式rehash的意思是rehash过程不是一次性的,也不是阻塞的,考虑到哈希表中可能存在有大量的数据,因此一次性进行rehash会耗时较长。所以在rehash过程中,也可以对哈希表进行增加或删除操作,增加的键会放在ht[1]表中,这样保证了ht[0]表只减不增,直到成为空表,rehash过程结束。