目录
简单动态字符串
Redis没有直接使用C语言传统的字符串,而是自己构建了一种名为简单动态字符串(SDS),的抽象类型,并且将SDS作为Redis的默认字符串表示。
在Redis中,C字符串只会作为字符串字面量。
SDS定义
SDS遵循C字符串以空字符结尾的惯例,保存空字符的1字节空间不计算在SDS的len属性中,并且为空字符分配额外的1字节空间,这么做的好处是SDS可以直接重用一部分C字符串函数库里面的函数。
SDS与C字符串的区别
比起C字符串,SDS具有以下优点:
- 常熟复杂度获取字符串长度
- 杜绝缓冲区溢出
- 减少修改字符串长度时所需的内存重分配次数
- 二进制安全
- 兼容部分C字符串函数
链表
链表由list结构和listNode结构组成
ListNode
List
Redis的链表实现的特性:
- 双端:链表节点带有prev和next指针,获取某个节点的前直接点和后置节点的复杂度都是O(1)
- 无环:表头结点的prev指针和表尾节点的next指针都指向NULL,对链表的访问以NULL为终点
- 带表头指针和表尾指针:通过list结构的head指针和tail指针,程序获取链表的表头结点和表尾节点的复杂度为O(1)
- 带链表长度计数器:程序使用list结构的len属性来对list持有的链表节点进行行技术,程序获取链表中节点数量的复杂度为O(1)
- 多态:链表节点使用void*指针来保存节点值,并且可以通过list结构的dup、free、match三个属性为节点值设置类型特定函数,所以链表可以用于保存各种不同类型的值。
字典
Redis的数据库就是使用字典来作为底层实现的
字典的实现
哈希表
Table属性是一个数组,数组中的每一个元素都是一个指向dicEntry结构的指针,每个dicEbtry结构保存着一个键值对
哈希表节点
Next属性指向另一个哈希表节点的指针,这个指针可以将多个哈希值相同的键值对连接在一起,以此来解决键冲突问题
字典
type
ht属性是一个包含两个项的数组,数组中的每个项都是一个dictht哈希表,一般情况下,字典只使用ht[0]哈希表,ht[1]哈希表只会在对ht[0]哈希表进行rehash时使用。
普通状态下的字典
解决键冲突
Redis哈希表使用链地址法来解决键冲突,每个哈希表节点都有一个next指针,多个哈希表节点可以用next指针构成一个单向链表,被分配到同一个索引上的多个节点可以用这个单向链表连起来,这就解决了键冲突的问题。
程序总是将新节点添加到链表的表头位置
rehash
rehash步骤:
- 为字典ht[1]哈希表分配空间,这个哈希表的空间大小取决于要执行的操作,以及ht[0]当前的键值对数量
- 如果执行的是拓展操作,那么ht[1]的大小为第一个大于等于ht[0].used*2的2^n
- 如果执行的是收缩操作,那么ht[1]的大小为第一个大于等于ht[0].used的2^n
- 将保存在ht[0]中的所有键值对rehash到ht[1]上面:rehash指的是重新计算键的哈希值和索引值,然后将键值对放置到ht[1]哈希表的指定位置上
- 当ht[0]包含的所有键值对都迁移到了ht[1]后,释放ht[0],将ht[1]设置为ht[0],并在ht[1]新创建一个空白哈希表,为下一次rehash做准备
哈希表的拓展与收缩
当以下条件的任意一个被满足时,程序会自动开始对哈希表执行拓展操作
- 服务器目前没有在执行BGSAVE命令或者BGREWRITEAOF命令。并且哈希表的负载因子大于等于1
- 服务器目前正在执行BGSAVE命令或者BGREWRITEAOF命令,并且哈希表的负载因子大于等于5
服务器执行拓展操作所需的负载因子不相同,这是因为在执行BGSAVE命令或BGREWRITEAOF命令的过程中,Redis需要创建当前服务器进程的子进程,而大多数操作系统都采用写时复制技术来优化子进程的使用效率,所以在子进程存在期间,服务器会提高执行拓展操作所需的负载因子,从而尽可能避免在子进程存在期间进行哈希拓展。
哈希表的负载因子小于0.1时,程序自动开始对哈希表执行收缩操作。
渐进式rehash
为了避免rehash对服务器性能造成影响,服务器不是一次性将ht[0]里面的所有键值对全部rehash到ht[1],而是分多次,渐进式的将ht[0]里面的键值对慢慢rehash到ht[1]。
渐进式rehash步骤
- 为ht[1]分配空间,让字典同时持有ht[0]和ht[1]两个哈希表
- 将字典中维持一个索引计数器变量rehashidx,并将它的值设置为0,表示rehash工作正式开始。
- 在rehash进行期间,每次对字典执行添加、删除、查找、或者更新操作时,程序除了执行指定的操作以外,还会顺带将ht[0]哈希表在rehashidx索引上的所有键值对rehash到ht[1],当rehash工作完成之后,程序将rehashidx属性的值增一
- 随着字典操作的不断执行,最终在某个时间点上,ht[0]的所有键值对都会被rehash至ht[1],这时程序将rehashidx属性的值设为-1,表示rehash完成。
渐进式rehash执行期间的哈希表操作
因为会使用两个表,所以在渐进式rehash进行期间,字典的删除、查找、更新等操作会在两个哈希表上进行,先会在ht[0]里面进行,如果没有的话,就会继续到ht[1]里面进行查找。
在渐进式rehash期间,新添加到字典的键值对一律会被保存到ht[1]里面