Redis的数据结构

1.Redis五种value结构

分别为String,Hash,list,set,zset。

Redis 的键值对中的 key 就是字符串对象,⽽ value 可以是字符串对象,也可以是集合数据类型的对象

⽐如 List 对象、Hash 对象、Set 对象和 Zset 对象。

2.Redis底层数据结构

Redis中value的底层数据结构实现如图:

Redis 是使用了⼀个「哈希表」保存所有键值对,哈希表的最大好处就是让我们可以用 O(1) 的时间复杂度来快速查找到键值对。哈希表其实就是⼀个数组,数组中的元素叫做哈希桶。

哈希桶存放的是指向键值对数据的指针(dictEntry*),这样通过指针就能找到键值对数据,然后因为键值对的值可以保存字符串对象和集合数据类型的对象,所以键值对的数据结构中并不是直接保存值本身,⽽是保存了 void * key 和 void * value 指针,分别指向了实际的键对象和值对象,这样⼀来,即使值是集合数据,也可以通过 void * value 指针找到。

 void * key 和 void * value 指针指向的是 Redis 对象,Redis 中的每个对象都由 redisObject结构表示,如下图:

 

象结构⾥包含的成员变量:

  • type,标识该对象是什么类型的对象(String 对象、 List 对象、Hash 对象、Set 对象和 Zset 对 象);
  • encoding,标识该对象使⽤了哪种底层的数据结构;
  • ptr,指向底层数据结构的指针

2.1 SDS

2.2链表 

2.3 压缩列表

压缩列表的最大特点,就是它被设计成⼀种内存紧凑型的数据结构,占用⼀块连续的内存空间,不仅可以利用CPU 缓存,而且会针对不同长度的数据,进行相应编码,这种方法可以有效地节省内存开销。

压缩列表是 Redis 为了节约内存而开发的,它是由连续内存块组成的顺序型数据结构,有点类似于数组。

  • zlbytes,记录整个压缩列表占用内存字节数;
  • zltail,记录压缩列表「尾部」节点距离起始地址由多少字节,也就是列表尾的偏移量;
  • zllen,记录压缩列表包含的节点数量;
  • zlend,标记压缩列表的结束点,固定值 0xFF(十进制255)
  • prevlen,记录了「前⼀个节点」的长度
  • encoding,记录了当前节点实际数据的类型以及⻓度;
  • data,记录了当前节点的实际数据;

在压缩列表中,如果我们要查找定位第⼀个元素和最后⼀个元素,可以通过表头三个字段的⻓度直接定位,复杂度是 O(1)。而查找其他元素时,就没有这么高效了,只能逐个查找,此时的复杂度就是 O(N) 了,因此压缩列表不适合保存过多的元素

压缩列表的缺点:存在连锁更新问题,缩列表新增某个元素或修改某个元素时,如果空间不不够,压缩列表占⽤的内存空间就需要重新分配。而当新插⼊的元素较大时,可能会导致后续元素的 prevlen 占⽤空间都发生变化,从而引起「连锁更新」 问题,导致每个元素的空间都要重新分配,造成访问压缩列表性能的下降。

  • 如果前⼀个节点的⻓度小于 254 字节,那么 prevlen 属性需要用1字节的空间来保存这个长度值;
  • 如果前⼀个节点的⻓度大于等于 254 字节,那么 prevlen 属性需要⽤5 字节的空间来保存这个长度值。

应用场景压缩列表只会用于保存的节点数量不多的场景,只要节点数量足够小,即使发⽣连锁更新,也是能接受的。

2.4哈希表

能以 O(1) 的复杂度快速查询数据。存在哈希冲突问题。

Redis 采用了「链式哈希」来解决哈希冲突,rehash

在实际使用哈希表时,Redis 定义⼀个 dict 结构体,这个结构体⾥定义了两个哈希表(ht[2])

为了避免 rehash 在数据迁移过程中,因拷贝数据的耗时,影响 Redis 性能的情况,所以 Redis 采⽤了渐进式 rehash,也就是将数据的迁移的工作不再是⼀次性迁移完成,而是分多次迁移。

rehash的触发条件,rehash 的触发条件跟负载因⼦(load factor)有关系

负载因子 = 哈希表已保存节点数量 / 哈希表大小

2.5整数集合

整数集合本质上是⼀块连续内存空间,它的结构定义如下:

typedef struct intset {

uint32_t encoding; //编码⽅式

uint32_t length; //集合包含的元素数量

int8_t contents[]; //保存元素的数组

} intset;

contents 数组的真正类型取决于 intset 结构体⾥的 encoding 属性的值。

整数集合会有⼀个升级规则,就是当我们将⼀个新元素加⼊到整数集合里面,如果新元素的类型(int32_t)比整数集合现有所有元素的类型(int16_t)都要长时,整数集合需要先进行升级。

2.6跳表(跨度和元素权重)

Redis 只有在 Zset 对象的底层实现用到了跳表,跳表的优势是能⽀持平均 O(logN) 复杂度的节点查找。

Zset 对象在使⽤跳表作为底层实现的时候,并不是指向跳表数据结构,⽽是指向了zset结构,它包含两个

数据结构⼀个是跳表,⼀个是哈希表。这样的好处是既能进行高效的范围查询,也能进行高效单点查询

跳表节点查询过程:(主要根据元素权重和元素大小来查询数据)

  • 如果当前节点的权重「小于」要查找的权重时,跳表就会访问该层上的下⼀个节点。
  • 如果当前节点的权重「等于」要查找的权重时,并且当前节点的 SDS 类型数据「小于」要查找的数据时,跳表就会访问该层上的下⼀个节点。

跳表的相邻两层的节点数量最理想的比例是 2:1,查找复杂度可以降低到 O(logN)

Redis 则采⽤⼀种巧妙的方法是,跳表在创建节点的时候,随机⽣成每个节点的层数,并没有严格维持相邻两层的节点数量比例为2:1的情况。

具体的做法是,跳表在创建节点时候,会生成范围为[0-1]的⼀个随机数,如果这个随机数小于 0.25(相当于概率 25%),那么层数就增加 1 层,然后继续⽣成下⼀个随机数,直到随机数的结果⼤于 0.25 结束,最终确定该节点的层数。

2.7quicklist

quicklist 就是「双向链表 + 压缩列表」组合,因为⼀个 quicklist 就是⼀个链表,⽽链表中的每个元素又是⼀个压缩列表。

quicklist 解决压缩列表的缺点的办法,通过控制每个链表节点中的压缩列表的大小或者元素个数,来规避连锁更新的问题。 因为压缩列表元素越少或越小,连锁更新带来的影响就越小,从而提供了更好的访问性能。

 

在向 quicklist 添加⼀个元素的时候,不会像普通的链表那样,直接新建⼀个链表节点。而是会检查插⼊位置的压缩列表是否能容纳该元素,如果能容纳就直接保存到 quicklistNode 结构⾥的压缩列表,如果不能容纳,才会新建⼀个新的 quicklistNode 结构。

2.8listpack

Redis 在 5.0 新设计⼀个数据结构叫 listpack,目的是替代压缩列表,它最⼤特点是 listpack 中每个节点不再包含前⼀个节点的长度了,压缩列表每个节点正因为需要保存前⼀个节点的长度字段,就会有连锁更新的隐患。

 listpack 没有压缩列表中记录前⼀个节点⻓度的字段了,listpack 只记录当前节点的长度,当我们向 listpack 加⼊⼀个新元素的时候,不会影响其他节点的长度字段的变化,从而避免了压缩列表的连锁更新问题。

参考:《小林coding》,网址:www.xiaolincoding.com

  • 14
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值