redis 系列——5、跳跃表

最新推荐文章于 2022-12-22 22:48:53 发布

吃饭睡觉胖胖胖

最新推荐文章于 2022-12-22 22:48:53 发布

阅读量236

点赞数 1

分类专栏： redis 文章标签：链表 java redis 数据结构

本文链接：https://blog.csdn.net/meiyongdesan/article/details/107359178

版权

redis 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

概述

上篇博客我简单介绍了 redis 字典的实现原理，本篇博客我打算整理 redis 跳跃表实现原理。关于抽象概念跳跃表相关知识可以点击这里查看我之前的博客。

跳跃表

跳跃表有一种有序数据结构，它通过在每个节点中维护多个指向其他节点的指针达到快速访问的目的。

跳跃表查询的平均复杂度为 O(log n)，最坏复杂度为 O(n)。在大多数情况下，它的效率和平衡树差不多，但技术难度上跳跃表相比平衡树简单许多。目前绝大多数程序使用跳跃表代替平衡树。

redis 使用跳跃表作为有序集合键（zSet）的实现方式之一：如果一个有序集合包含的元素数量比较多，或者说集合元素都是比较长的字符串时，redis 使用跳跃表作为有序集合键的实现原理。

除了有序集合键外，redis 还在集群节点中使用跳跃表作为内部数据结构，其中 redis 仅仅在这两块内容用到跳跃表。

zSkipListNode

redis 跳跃表是由头文件 redis.h 中的 zSkipListNode 和 zSkipList 两结构实现的：

zSkipList：记录跳跃表本身，通过它快速访问和跳跃表相关的常用属性
zSkipListNode：跳跃表中节点元素，通过它记录所有节点值

下面我们首先来看 zSkipListNode 的结构：

typedef struct zskiplistNode {
    // 层
    struct zskiplistLevel {
        // 前进指针
        struct zskiplistNode *forward;
        // 跨度
        unsigned int span;
    } level[];
    // 后退指针
    struct zskiplistNode *backward;
    // 分值
    double score;
    // 成员对象
    robj *obj;
} zskiplistNode;

level：跳跃表的层级，其中每个数组元素包含两个属性：指针和跨度
backward：跳跃表本身基于链表，通过该属性获取前一个 zskiplistNode 结构节点
score：跳跃表必须包含可以判断大小的字段，通过该字段进行排序
obj：记录元素属性值

level

每个跳跃表节点 level 数组的长度是随机的，redis 跳跃表默认最大长度为32。一般情况下，数组的长度越大，跳跃表的查询效率越高，关于其中原理可以参考概述中引用的博客内容。

level 数组元素的 forward 属性是指向 zSkipListNode 结构的指针，通过它指向后面的跳跃表节点，需要注意的一点是：forwared 属性指向包含该层级的第一个后续节点。

下面我举个简单的例子，假设现在存在5个跳跃表节点，它们随机出的 level 数组长度分别为 5、3、1、4，5。下面我通过简单图片描述该关系：

指针关系
上图是一个抽象视图，我主要想表达 level 数组指针指向包含当前层级的下一个节点。

假设此时我们需要查询元素C：从元素A开始，根据最高层数组指针，直接判断元素E，发现元素E不是所求后，回到元素A。根据次高层指针，判断元素D不为所求后，回到元素A…依次一层一层向下遍历。这里我省略了根据 score 属性判断的过程，主要想说明：跳跃表遍历总是从 最高层数组 指针所形成的链表开始，依次向下遍历。

如果说 forwared 属性是指向包含当前层的下一个节点，那么 span 属性就是用来记录当前节点和被指向节点的距离。

就拿上图来说，我简单列举出几个元素数组元素的 span 值：

假设下标从1开始，和上图方块相对应。
A元素：
level[5].span = 4
level[4].span = 3
level[3].span = 1

B元素：
level[3].span = 2
level[2].span = 2
level[1].span = 1
...

span 属性值越大，说明两个节点越远。它的值可以通过下层数组元素的 span 属性加合得到，而 level[1].span 除尾节点外，总是等于1。

遍历链表时，只需要 forwared 属性即可，span 属性主要用来计算节点间距离。

backward

backward 属性表示后退指针，通过该属性获取上一个节点。需要注意的一点是：除头节点外，其他节点总是指向 level 数组中 span 属性为1的节点，也就是最底层链表的前驱节点。具体我们看示例：

通过 backward 属性，redis 将链表改造为双向链表，方便从尾部向前遍历。

score 和 obj

在前面关于跳跃表的博客中，我们提到跳跃表必须包含可以用来排序的属性。否则，跳跃就失去了意义，使用跳跃表不会带来任何效率提升。

redis 使用 double 类型的 score 属性作为节点元素排序的基础，score 属性较小的元素排在链表前面，score 属性较大的元素排在后面。
redis 使用 obj 保存节点元素属性，除了用来排序的属性外，其他属性都可以在 obj 中进行记录。

下面我通过简单抽象示图描述其关系：

总结一下：obj 主要记录属性，score 主要用来排序。查找元素时根据 level 数组指针遍历，遍历过程中通过 score 属性判断向前遍历，还是退回到原节点，通过数组下一层组成的链表遍历。

zSkipList

zSkipList 的结构如下图所示：

typedef struct zskiplist {
    // 表头节点和表尾节点
    structz skiplistNode *header, *tail;
    // 表中节点的数量
    unsigned long length;
    // 表中层数最大的节点的层数
    int level;
} zskiplist;