(Redis) 跳跃表(skiplist)实现原理

跳跃表简介

跳跃表(skiplist)是一种随机化的数据, 由 William Pugh 在论文《Skip lists: a probabilistic alternative to balanced trees》中提出, 跳跃表以有序的方式在层次化的链表中保存元素, 效率和平衡树媲美 —— 查找、删除、添加等操作都可以在对数期望时间下完成, 并且比起平衡树来说, 跳跃表的实现要简单直观得多。

以下是个典型的跳跃表例子(图片来自维基百科):
在这里插入图片描述

有序链表

如下图所有,有一个有序(按score从小到大排序)双向链表。当我们要在该链表中查找score = 13 的节点时,我们只能从链表的头节点开始,依次向下比较查找(图中红色箭头所示),需要访问7个节点,算法时间复杂度为 O(n)。
在这里插入图片描述
在上述链表中,虽然我们知道节点的排列是有序的,但是由于我们每次只能从一个节点访问到相邻的下一个节点,因此我们只能依次遍历每个节点进行查找。

优化

那么,要是有些节点存在不止一个可访问的后继节点呢?这样的话找查找时,我们就不必遍历每一个节点,而是可以跳跃的访问链表中的节点。

如下图所示,我们添加 L2 层访问指针,让其中一些节点不仅可以访问相邻的后继节点,还可以访问第二个后继节点。那么现在我们要查找 score = 13 的节点时,可以先在 L2层上向后查找到可以到达的最右节点 11(score <= 13),然后在 forward 层(也可以称为 L1层)上向后查找,最后找到 score = 13的节点需要访问4个节点。速度快了一倍!!!
在这里插入图片描述
所以,要是我们能够在节点上继续往上添加更高层的访问指针(层数越高,节点的跨度越大),那么查找的速度会越来越快,到达 log级别。

跳跃表

跳跃表就是遵循了上述的优化思想,让每个节点拥有一个指针数组,使它们能够进行多级的跳跃,从而将查找的时间复杂度降低为O(log n)。

跳跃表节点的定义:

typedef struct zskiplistNode {
    robj *obj;
    double score;
    struct zskiplistNode *backward; //后向指针
    struct zskiplistLevel {
        struct zskiplistNode *forward;//每一层中的前向指针
        unsigned int span;//x.level[i].span 表示节点x在第i层到其下一个节点需跳过的节点数。注:两个相邻节点span为1
    } level[];
} zskiplistNode;

用图像表示就是这样:
在这里插入图片描述
其中,我们将指针数组的最大长度设置为32。多个zskiplistNode就组成了一个跳跃表。

我们使用zskiplist数据结构来表示跳跃表:

#define ZSKIPLIST_MAXLEVEL 32 //最大层数
#define ZSKIPLIST_P 0.25 // 1/P

typedef struct zskiplist {
    struct zskiplistNode *header, *tail; //头节点, 尾节点
    unsigned long length;//节点总数
    int level;//总层数
} zskiplis

随机算法

跳跃表中,每个节点的指针数组长度是不一样的,是一个在[1,32]之间的随机整数,随机算法如下:

int zslRandomLevel(void) {
    int level = 1;
    // TODO 了解这个公式背后的数学原理
    while ((random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF))
        level += 1;
    return (level<ZSKIPLIST_MAXLEVEL) ? level : ZSKIPLIST_MAXLEVEL;
}

使用随机算法,在概率上可以保证上一层的节点数为下一层的1/P。那么SkipList可以看成是一棵平衡的P叉树,从最顶层开始查找某个节点需要的时间是O(logpN)。
每个跳跃表节点中的指针数组中的每一层,都指向随后一个指针数组大小大于等于该节点指针数据大小的节点。

一次典型的跳跃表查询过程

在这里插入图片描述
如上图所示,在上述跳跃表中查找 score = 7的节点过程为:

  • 在L4层上找到满足条件(score <= 7)的最右节点 1,1 < 7 所以继续向下层查找。
  • 在L3层上找到满足条件(score <= 7)的最右节点 6,6 < 7 所以继续向下层查找。
  • 在L2层上找到满足条件(score <= 7)的最右节点 6,6 < 7 所以继续向下层查找。
  • 在L1层上找到满足条件(score <= 7)的最右节点 7,7 = 7 查找完毕。
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Redis跳跃表Skip List)是一种有序数据结构,用于实现有序集合(Sorted Set)数据类型。在Redis中,插入和更新操作都是基于跳跃表进行的。 对于插入操作,Redis使用跳跃表来维护有序集合。当需要将一个新的元素插入到有序集合中时,Redis首先会在跳跃表中寻找插入位置。通过跳跃表的索引层,Redis可以快速定位到需要插入的位置,而不必遍历整个有序集合。 具体的插入过程如下: 1. 生成一个随机层数level,决定要在跳跃表中插入的元素的索引层高度。 2. 从跳跃表的最高层开始,沿着索引层逐层下降,寻找插入位置,并记录每一层上离插入位置最近的节点。 3. 在底层插入新元素,并将该元素连接到每一层上离插入位置最近的节点。 4. 根据一定的概率,判断是否将新插入的元素提升为索引层的节点。 对于更新操作,Redis将其视为先删除旧元素,再插入新元素的操作。具体的更新过程如下: 1. 在跳跃表中搜索要更新的元素。 2. 如果找到了要更新的元素,从跳跃表中删除该元素。 3. 根据插入操作的方法,在跳跃表中插入新元素。 插入和更新操作都利用了跳跃表的特性,即通过索引层的建立,可以快速定位和搜索元素,从而提高插入和更新操作的效率。跳跃表的插入和更新操作时间复杂度都是O(log n),其中n是有序集合中元素的数量。因此,Redis利用跳跃表实现了高效的插入和更新功能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值