Redis系列(七)底层数据结构之跳跃表

最新推荐文章于 2023-04-05 10:51:46 发布

呼延十

最新推荐文章于 2023-04-05 10:51:46 发布

阅读量406

点赞数

分类专栏： Redis 数据结构及算法文章标签： redis

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_24629159/article/details/103946056

版权

数据结构及算法同时被 2 个专栏收录

38 篇文章 1 订阅

订阅专栏

11 篇文章 1 订阅

订阅专栏

前言
定义
层级问题
顺序问题
排名问题
总结
参考文章
联系我

前言

Redis 已经是大家耳熟能详的东西了，日常工作也都在使用，面试中也是高频的会涉及到，那么我们对它究竟了解有多深刻呢？

我读了几本 Redis 相关的书籍，尝试去了解它的具体实现，将一些底层的数据结构及实现原理记录下来。

本文将介绍 Redis 中底层的 skiplist（跳跃表） 的实现方法。它是 Redis 中有序集合键底层实现之一。

2020-01-06-22-16-38

可以看到图中，当我在zsetkey中放入了两个简单的值时，编码为** ziplist**, 而当我插入一个较长的值，zset 的编程方式成为了 skiplist.

对于跳跃表这个数据结构，其底层实现原理及代码实现，本文就不细讲了，如果不太清楚的读者可以看一下这个文章跳表的原理, 或者自行 google 了解。

本文仅对 Redis 中跳跃表的实现做一个学习。

定义

首先让我们来看一下，skiplist 的定义：

typedef struct zskiplist{
    // 表头结点和尾节点
    struct zskiplistNode *header, *tail;
    // 表中节点的数量
    unsigned int length;
    // 表中层数最大的节点的层数
    int level;
} zskiplist;

这几个属性比较简单，其中header, tail可以在 O(1) 的时间复杂度内定位到跳跃表的头部和尾部，length可以在 O(1) 时间复杂度内得到跳跃表的长度。level可以知道当前跳跃表最高的层，从而开始从高向低进行查找。

其中 skiplistNode 的节点的定义为：

typedef struct zskiplistNode{
    struct zskiplistLevel{
        // 前进指针
        struct zskiplistNode *forward;
        // 跨度
    } level[];
    // 后退指针
    struct zskiplistNode *backward;
    // 分值
    double score;
    // 成员对象
    robj *obj;
} zskiplistNode;

这个节点的定义有点东西的。

如果了解 Java 中的ConcurrentSkipListMap的实现，或者看了上面我的那篇文章的话，就会知道，在 Java 中，一个所谓的 节点（或者叫索引） 是有两个指针的，一个指向右侧的下一个索引，一个指向自己的下一层索引。

但是 Redis 不是这么实现的，在上面的定义中，可以看到zskiplistLevel这个结构是一个数组，用一个数组来保存，本节点，以及本节点在所有层的索引.

每个索引中，有两个属性，

forward

指向右侧的指针，可以在当前层，继续向右走。

跨度

这个属性设计的很巧妙，可以用它来计算当前节点在跳跃表中的一个排名，这就 zset 提供了查看排名的功能。

backward

后退的指针，如果在高层索引向右走的太多了，可以用后退指针来向后退。

score and obj

这两个属性用来保存当前节点的真正值以及分值。

层级问题

在 Java 中的ConcurrentSkipListMap的实现中，索引每一次向上升级或者不升级，都是随机的，因此：

一个节点是否是一级索引的概率是 50%.
是否是二级索引的概率是 25%.
…

而在 Redis 中，新添加一个节点时，会给该节点随机一个索引层数，而且概率是 25%. 之后将该节点的各层索引与左右的索引相链接。

由于概率是 25%, 因此 Redis 的跳跃表相对于 Java 中的跳跃表，结构更加扁平一些，在查找的时候，在同级索引上可能需要多查询几个。

也是因为结构扁平，因此索引的数量并不是完全的等同于节点数，额外的内存占用只有 50%. 可以为 Redis 服务器节省一点内存。

顺序问题

我们知道，在 zset 中，是可以存储分数一样的值的，此时内部如何存储？直接进行无序存储吗？

如果是这样，当一个 zset 中，所有元素的分值都一样，跳跃表表的性能就会退化成链表的性能吗？

不是这样的，Redis 除了按照分值排序之外，还会按照字符串的字典序来存储。

排名问题

前面提到了 跨度 这个属性，当我们需要查找某个元素的排名时，跳跃表首先开始一次查询过程，找到该节点时，也可以找到从顶层索引找到该节点的 查找路径, 将路径上的所有节点的跨度值相加就是该节点的排名。

总结

Redis 的跳跃表，和其他语言实现的跳跃表，总体思路一样，在实现方式上有一些自己的小技巧。

跳跃表示有序集合键的底层实现之一，表中元素按照 score 大小进行排序，当 score 相同时，元素按照字符串的字典大小进行排序。

相比于 Java 的跳跃表，Redis 的跳跃表的索引层级更加扁平，可以节省一些内存。

参考文章

《Redis 的设计与实现（第二版）》

《Redis 深度历险：核心原理和应用实践》

完。

联系我

最后，欢迎关注我的个人公众号【呼延十】，会不定期更新很多后端工程师的学习笔记。
也欢迎直接公众号私信或者邮箱联系我，一定知无不言，言无不尽。

以上皆为个人所思所得，如有错误欢迎评论区指正。

欢迎转载，烦请署名并保留原文链接。

联系邮箱：huyanshi2580@gmail.com

更多学习笔记见个人博客或关注微信公众号 < 呼延十 >------>呼延十

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

呼延十 CSDN认证博客专家 CSDN认证企业博客

码龄10年

97: 原创

5万+: 周排名

87万+: 总排名

16万+: 访问

: 等级

2370: 积分

31: 粉丝

62: 获赞

25: 评论

244: 收藏

私信

关注

热门文章

分类专栏

Lucene 4篇
Redis 11篇
NLP 4篇
机器学习 1篇
每日一题 10篇
java8新特性 6篇
java 26篇
Android
web 2篇
spring boot 4篇
数据结构及算法 38篇
shell 2篇
MySql 7篇
开发者手册 11篇
linux 5篇
实际问题解决 3篇
随缘一题 14篇
LintCode 8篇
设计模式 6篇
读书笔记 4篇
笔试面试 12篇
DEBUG 2篇
多线程 1篇

最新评论

二分法查找及有重复值的二分法
追逐远方的梦: 先找到一个，剩下的线性扫描
TOP-K问题
追逐远方的梦: 不错，很经典的问题
lucene系列(四)DirectMonotonicWriter源码分析
CSDN-Ada助手: 非常感谢CSDN博主分享的“lucene系列(四)DirectMonotonicWriter源码分析”博客，对于想要深入学习lucene的开发者来说，这是一篇非常有价值的技术文章。建议下一篇博客可以从lucene搜索算法优化的角度出发，分享一些优化搜索性能的技巧和经验，相信会对其他用户有很大的帮助。期待更多精彩的技术分享！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
二分法查找及有重复值的二分法
hryiii: 不能找到所有的重复数吗，只能找最边上的吗
[设计模式]-策略模式
彼方: 好文，已收藏，大佬有兴趣也可以看下我的博客，说不定也会有所有收获哦~

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。