redis5.0源码浅析5-跳跃表skiplist

最新推荐文章于 2024-05-25 13:03:20 发布

chenchangqun11

最新推荐文章于 2024-05-25 13:03:20 发布

阅读量198

点赞数

分类专栏： redis5.0源码分析

本文链接：https://blog.csdn.net/chenchangqun11/article/details/106907337

版权

redis5.0源码分析专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1.skiplist介绍

定义：跳跃表是一个有序链表，其中每个节点包含不定数量的链接，节点中的第i个链接构成的单向链表跳过含有少于i个链接的节点。
跳跃表支持平均O(logN)，最坏O(N)复杂度的节点查找，大部分情况下，跳跃表的效率可以和平衡树相媲美。
跳跃表在redis中当数据较多时作为有序集合键的实现方式之一。

接下来，还是举个有序集合键的例子：有序集合键详解

127.0.0.1:6379> ZADD score 95.5 Mike 98 Li 96 Wang //socre是一个有序集合键

(integer) 3

127.0.0.1:6379> ZRANGE score 0 -1 WITHSCORES//所有分数按从小到大排列，每一个成员都保存了一个分数

1) "Mike"

2) "94.5"

3) "Wang"

4) "96"

5) "Li"

6) "98"

127.0.0.1:6379> ZSCORE score Mike //查询Mike的分值

"94.5"

2.结构体分析

跳表节点

typedef struct zskiplistNode {

sds ele; //保存成员数据的字符串

double score; //分值

struct zskiplistNode *backward;//后退指针

struct zskiplistLevel {//索引层结构

struct zskiplistNode *forward;//前进指针

unsigned long span;//跨度

} level[];

} zskiplistNode;

一个zskiplistNode 包含多个zskiplistLevel 组成 level[]，每一个zskiplistLevel 都是其对应层的一个索引节点

typedef struct zskiplist {

struct zskiplistNode *header, *tail;//头节点尾部节点

unsigned long length;//节点数

int level;//最大层级

} zskiplist;

3.主要函数分析

3.1 创建跳跃表

zskiplist *zslCreate(void) {

int j;

zskiplist *zsl;

zsl = zmalloc(sizeof(*zsl));

zsl->level = 1;

zsl->length = 0;

zsl->header = zslCreateNode(ZSKIPLIST_MAXLEVEL,0,NULL);//创建一个层级是32，分数是0，成员数据是NULL的头节点

for (j = 0; j < ZSKIPLIST_MAXLEVEL; j++) {// 初始化头节点的层级数组的元素，前进元素指向NULL，跨度为0

zsl->header->level[j].forward = NULL;

zsl->header->level[j].span = 0;

}

zsl->header->backward = NULL;//头节点的后退指针指向NULL

zsl->tail = NULL;//尾节点指向 NULL

return zsl;

}

创建一个层级是32，分数是0，成员数据是NULL的头节点是要注意的地方

3.2 插入节点

跳跃表的中每一个层级相当于一层索引，称为索引层，插入新节点时要同时插入相关的索引层，将插入索引层的节点叫做索引节点。

一个跳表节点包含一个level[]，即多个索引节点

在 zsl 跳跃表中插入分数为score，成员数据为ele的节点

zskiplistNode *zslInsert(zskiplist *zsl, double score, sds ele) {

zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;

unsigned int rank[ZSKIPLIST_MAXLEVEL];

int i, level;

serverAssert(!isnan(score));

x = zsl->header;

for (i = zsl->level-1; i >= 0; i--) {//遍历所有层级收集 update[] 和rank[]数据步骤1

/* store rank that is crossed to reach the insert position */

//rank[i] 代表序号i的i+1层的跨越节点总数，下面的逻辑是因为每次循环都是从 i+1层的x节点开始，相当于rank[i]的初始值是rank[i+1]

//zsl->level-1==0 说明是从头节点开始计算，于rank[i]的初始值是0

rank[i] = i == (zsl->level-1) ? 0 : rank[i+1];

while (x->level[i].forward &&

(x->level[i].forward->score < score |||//只要分数小于参数score 向后遍历

(x->level[i].forward->score == score &&//分数相等且参数key字符串值相大于等于下个节点

sdscmp(x->level[i].forward->ele,ele) < 0)))

{//重点：这里说明分数相同时，按照key的字符串值从小到大排列

rank[i] += x->level[i].span;

x = x->level[i].forward;

}

update[i] = x;//保存了每一个层分值小于等新节点score的最后一个节点，相当于保存了每个索引层中新节点的前置节点

//update[0] 就是要插入跳表节点的前置跳表节点

}

//update[0] 代表 level1 层级中的跳表节点，目前的这个跳跃表结构 level1是最小的索引层，一定包含了所有数据节点的索引节点，

//所以update[0] 就是要插入节点的前置节点。

// 执行步骤1 是因为插入新的节点可能需要在多个层插入，收集 update[]方便插入，收集rank[]数据，方便计算索引节点的跨度

/* we assume the element is not already inside, since we allow duplicated

* scores, reinserting the same element should never happen since the

* caller of zslInsert() should test in the hash table if the element is

* already inside or not. */

//注释：允许相同的分数，不允许有相同的成员数据，调用者在执行前应该检查利用hash table结构

//实际上调用 zslInsert()前已经做了这样的检查，可以放心执行。

level = zslRandomLevel();//获取 level 返回1的概率50%，2：25% 3:12.5% 以此类推数越大概率越小，最大返回32

if (level > zsl->level) {// 如果获取的索引级别当前的值大

for (i = zsl->level; i < level; i++) {//初始化新增的索引级别

rank[i] = 0;//跨度都是0

update[i] = zsl->header;//这个层级相对于新增节点的前置节点都是header,因为这个层级还没加入其它索引节点

update[i]->level[i].span = zsl->length;//索引节点的跨度是总节点个数

}

zsl->level = level;

}

x = zslCreateNode(level,score,ele);

for (i = 0; i < level; i++) {//遍历update[]插入新节点

//插入索引节点

x->level[i].forward = update[i]->level[i].forward;

update[i]->level[i].forward = x;

/* update span covered by update[i] as x is inserted here */

//计算并更新前置节点和索引节点跨度，因为插入一个索引节点这个节点的跨度肯定需要计算然后导致前置节点跨度发生变化

x->level[i].span = update[i]->level[i].span - (rank[0] - rank[i]);//(rank[0] - rank[i]) 计算的是 x->level[i]与前置节点跨度差，

//update[i]->level[i].span 是 x->level[i] 到x->level[i]->forward 节点的跨度，就像我剪短一根绳子后一段长度= 总长度 -前1一段长度

update[i]->level[i].span = (rank[0] - rank[i]) + 1;//增加一个节点自然要加1

}

/* increment span for untouched levels */

for (i = level; i < zsl->level; i++) {//比较高的层级没有插入新的索引节点，但实际上总体增加了一个节点，对应层级的前置节点跨度需要加1

update[i]->level[i].span++;

}

//前面分析过 update[0]是前置跳表节点

x->backward = (update[0] == zsl->header) ? NULL : update[0];

if (x->level[0].forward)//设置x的下个节点的后退节点是x

x->level[0].forward->backward = x;

else//x没有下个节点设置 zsl的尾部节点是x

zsl->tail = x;

zsl->length++;

return x;

}

3.2 删除节点

/* Internal function used by zslDelete, zslDeleteByScore and zslDeleteByRank */

void zslDeleteNode(zskiplist *zsl, zskiplistNode *x, zskiplistNode **update) {

int i; //在执行删除之前获取 update，这里的update代表的是指向zskiplistNode 数组的指针，与插入中update[]相同

//都保存了 x 在每个索引层级的前置跳表节点

for (i = 0; i < zsl->level; i++) {

if (update[i]->level[i].forward == x) {//再次确认一下是前置节点删除关联

update[i]->level[i].span += x->level[i].span - 1;

update[i]->level[i].forward = x->level[i].forward;// 把前置节点的前进指针指向要删除节点的下个节点是比较常用的链表删除节点方法

} else {

update[i]->level[i].span -= 1;//节点已经被删除

}

if (x->level[0].forward) {//删除forward关联

x->level[0].forward->backward = x->backward;

} else {

zsl->tail = x->backward;

}

while(zsl->level > 1 && zsl->header->level[zsl->level-1].forward == NULL)

zsl->level--;//删除一个节点导致减少一个层级，记录一下

zsl->length--;

//删除节点后没有回收内存，推断在一个完整的删除中，有回收的处理。

}

3.3 获取节点排名

根据节点key和分数获取节点排名，要求key对应的节点必须存在，这个节点的分数必须大于等于传入的分数

unsigned long zslGetRank(zskiplist *zsl, double score, sds ele) {

zskiplistNode *x;

unsigned long rank = 0;

int i;

x = zsl->header;

for (i = zsl->level-1; i >= 0; i--) {

while (x->level[i].forward && //遍历的方法与插入大体相同

(x->level[i].forward->score < score |

(x->level[i].forward->score == score &&

sdscmp(x->level[i].forward->ele,ele) <= 0))) {//注意这里多个了 ‘=’ 也就是说遇到 key相等的情况还向后遍历。

//与插入不同插入是为了找前置节点查找是是为了获取key对应的节点，所以这里要多向后遍历一步

rank += x->level[i].span;

x = x->level[i].forward;

}

/* x might be equal to zsl->header, so test if obj is non-NULL */

if (x->ele && sdscmp(x->ele,ele) == 0) {//key必须相等，就是说key对应的节点必须存在。

return rank;

}

return 0;

}

逻辑比较简单每个节点都记录了跨度，累加遍历节点跨度就是排名，执行遍历跳表找到key值相等分数大于等于传入分数的节点，累加排名，返回排名。

3.4范围查找

查找指定范围内的第一个节点

zskiplistNode *zslFirstInRange(zskiplist *zsl, zrangespec *range) {//range 表示一个返回包含一个最小值和一个最大值

zskiplistNode *x;

int i;

/* If everything is out of range, return early. */

if (!zslIsInRange(zsl,range)) return NULL;//检查 zsl中的节点是否在 range表示的范围内

x = zsl->header;

for (i = zsl->level-1; i >= 0; i--) {

/* Go forward while *OUT* of range. */

while (x->level[i].forward &&//下个节点有效

!zslValueGteMin(x->level[i].forward->score,range))// 下个节点小于 range中的最小值

x = x->level[i].forward;

}

// x的下个节点刚好大于range中的最小值,前进一个节点

/* This is an inner range, so the next node cannot be NULL. */

x = x->level[0].forward;

serverAssert(x != NULL);/

/* Check if score <= max. */

if (!zslValueLteMax(x->score,range)) return NULL; //检查是否大于 range中的最大值

return x;

}

zslLastInRange ：查找指定范围内的最后一个节点，某些判断与zslFirstInRange相反，处理逻辑相同。就不详细分析了

chenchangqun11

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
redis5.0源码浅析5-跳跃表skiplist

1.skiplist介绍定义：跳跃表是一个有序链表，其中每个节点包含不定数量的链接，节点中的第i个链接构成的单向链表跳过含有少于i个链接的节点。跳跃表支持平均O(logN)，最坏O(N)复杂度的节点查找，大部分情况下，跳跃表的效率可以和平衡树相媲美。跳跃表在redis中当数据较多时作为有序集合键的实现方式之一。接下来，还是举个有序集合键的例子：有序集合键详解127.0.0.1:6379> ZADD score 95.5 Mike 98 Li 96 Wang //socre是一个有序集
复制链接

扫一扫

专栏目录