redis源码解析-基础数据-skiplist(跳跃表)

最新推荐文章于 2022-12-09 15:19:58 发布

置顶

Knight0xffff

最新推荐文章于 2022-12-09 15:19:58 发布

阅读量651

点赞数 4

分类专栏：源码分析文章标签： redis 源码数据结构跳表 c语言

本文链接：https://blog.csdn.net/weixin_45827856/article/details/103254965

版权

太长不看版

跳跃表是有序集合的底层实现之一，除此之外它在 Redis 中没有其他应用。

每个跳跃表节点的层高都是 1 至 64 之间的随机数

层高越高出现的概率越低，层高为i的概率为 $1-p) * p^{i-1}, (p=1/4)$ 。

跳跃表中，分值可以重复，但对象成员唯一。分值相同时，节点按照成员对象的大小进行排序。

本篇解析基于redis 5.0.0版本，本篇涉及源码文件为t_zset.c, server.h。

什么是跳跃表

跳表是一个随机化的数据结构，实质就是一种可以进行二分查找的有序链表。

我们都知道在有序数组中进行查找，可以使用二分查找，将时间复杂度降为O(log n)。但是有序链表做不到，是因为有序链表获取某元素复杂度为O(n)，无法通过二分的思想去跳过一些元素的访问。

例如下图要查找元素50,就必须 5 -> 6 -> 10 -> 30 -> 49 这样去找，而不能说先看中心元素49小于50，则开始从中心右边开始查找，跳过元素5，6，10， 30的访问。

而跳跃表则是通过在节点中提取索引的方式，实现有序链表的快速查找。本质上是一个空间(额外的步进指针)换时间的操作。例如下图：

这时查找元素50变成了 5 -> 49,略过了中间元素6，10， 30。上图中通过首节点存储不同步长的指针将链表完美二分，但是实际上的跳表却类似与下面这张图的结构,大部分情况喜爱不是完美二分的：

跳跃表采用了随机算法(层高越高概率越小)来决定层高，相同层之间通过指针相连。redis实现中某节点层高为i的概率为 $1-p) * p^{i-1}$ 。

为什么不采用最完美的二分结构？

考虑一下，插入节点的情况。当中间插入一个节点，此时的二分结构会被打破，所以需要不断的进行调整。想想平衡树，红黑树复杂的再平衡操作，而此处的再平衡调整比之有过之而无不及。而使用随机算法进行层高选择的方法也可以实现O(logN)的平均复杂度，而且操作也相对简化的很多。

跳跃表(redis实现)的空间复杂度

相关定义

// 层高最大值限制
#define ZSKIPLIST_MAXLEVEL 64 /* Should be enough for 2^64 elements */
// 层高是否继续增长的概率
#define ZSKIPLIST_P 0.25      /* Skiplist P = 1/4 */
// 跳表节点定义
typedef struct zskiplistNode {
   
    // 存储内容
    sds ele;
    // 分值,用于排序
    double score;
    // 后退指针
    struct zskiplistNode *backward;
    // 变长数组，记录层信息。层高越高跳过的节点越多(因为层高越高概率越低)
    struct zskiplistLevel {
   
        // 指向当前层下一个节点
        struct zskiplistNode *forward;
        // 当前节点与forward所指节点中间节点数
        unsigned long span;
    } level[];
} zskiplistNode;
// 跳表结构管理节点
typedef struct zskiplist {
   
    struct zskiplistNode *header, *tail;
    // 长度
    unsigned long length;
    // 跳表高度(所有节点最高层高)
    int level;
} zskiplist;

int zslRandomLevel(void) {
   
    // 计算当前插入元素层高的随机函数
    int level = 1;
    // (random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF) 概率为1/4
    while ((random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF))
        level += 1;
    return (level<ZSKIPLIST_MAXLEVEL) ? level : ZSKIPLIST_MAXLEVEL;
}

层高为1概率为 1-p(不进while)

层高为2的概率为 p(进一次while) * (1 - p)(不进while)

层高为3的概率为 p(进一次while) * p(进一次while) * (1 - p)(不进while)

…

层高为n的概率为 $1-p) * p^{n-1}$

最低0.47元/天解锁文章

Knight0xffff

关注

4
点赞
踩
2

收藏

觉得还不错? 一键收藏
4
评论
redis源码解析-基础数据-skiplist(跳跃表)

太长不看版跳跃表是有序集合的底层实现之一，除此之外它在 Redis 中没有其他应用。每个跳跃表节点的层高都是 1 至 64 之间的随机数层高越高出现的概率越低，层高为i的概率为(1−p)∗pi−1,(p=1/4)(1-p) * p^{i-1}, (p=1/4)(1−p)∗pi−1,(p=1/4)。跳跃表中，分值可以重复，但对象成员唯一。分值相同时，节点按照成员对象的大小进行排序。...
复制链接

扫一扫