本文内容均来自《Redis设计与实现》一书
跳跃表是一种有序数据结构,它通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的。
跳跃表支持平均O(logN)、最坏O(N)复杂度的节点查找,还可以通过顺序性操作来批量处理节点。
跳跃表的效率可以和平衡树相媲美,并且跳跃表的实现比平衡树要简单,所以不少程序都使用跳跃表来代替平衡树。
Redis使用跳跃表作为有序集合键的底层实现之一,如果一个有序集合包含的元素数量较多,又或者有序集合中元素的成员是比较长的字符串时,Redis就会使用跳跃表来作为有序集合键的底层实现。
1.定义
结构
// 跳跃表节点
tyepdef struct zskiplistNode {
// 后退指针
struct zskiplistNode *backward;
// 分值
double score;
// 成员对象
robj *obj;
// 层
struct zskiplistLevel {
// 前进指针
struct zskiplistNode *forward;
// 跨度
unsigned int span;
} level[];
} zskiplistNode;
// 跳跃表
typedef struct zskiplist {
// 表头节点和表尾节点
struct zskiplist *header, *tail;
// 表中节点的数量
unsigned long length;
// 表中层数最大的节点的层数
int level;
} zskiplist;
跳跃表示例
2.跳跃表节点
层(level):跳跃表节点的level数组可以包含多个元素,每个元素都包含一个指向其他节点的指针,程序可以通过这些层来加快访问其他节点的速度,一般来说,层数越多,访问其他节点的速度越快。每次创建一个新的跳跃表节点时,程序会根据幂次定律随机生成一个介于1和32之间的值作为level数组的大小,这个大小就是层的高度。
前进指针(forward):每个层都有一个指向表尾方向的前进指针,用于从表头向表尾方向访问节点,当访问到一个NULL时,结束这次遍历。
跨度(span):用于记录两个节点之间的距离。
- 两个节点之间的跨度越大,它们相距得越远。
- 指向NULL的所有前进指针的跨度都为0,因为它们没有连向任何节点。
后退指针(backward):用于从表尾向表头访问节点,跟可以一次跳过多个节点的前进指针不同,因为每个节点只有一个后退指针,所以每次只能后退至前一个节点。
分值和成员(score obj):分值是一个double类型的浮点数,跳跃表中的所有节点都按照从小到大来排序。成员对象是一个指针,它指向一个字符串对象,而字符串对象则保存着一个SDS值。同一个跳跃表中,各个节点保存的成员对象必须是唯一的,但是多个节点保存的分值却是可以是相同的,分值相同的节点将按照成员对象在字典中的大小来进行排序,成员对象较小的节点会排在前面,而成员对象较大的节点则会排在后面。
3.跳跃表
表头指针和表尾指针(header tail):分别指向跳跃表的表头指针和表尾指针,通过这两个指针,程序访问表头节点和表尾节点的复杂度为O(1)。
表中节点的数量(length):记录节点的数量,程序可在O(1)复杂度内返回跳跃表的长度。
表中层数最大的节点的层数(level):用于O(1)复杂度内获取跳跃表中层数最大的那个节点的层数,表头节点的层高除外。