简介
跳跃表是一种有序数据结构,它通过在每个节点中维持多个指向其他节点指针,从而达到快速访问节点目的。
跳跃表支持平均O(logN)、最坏O(N)复杂度的节点查找,还可以通过顺序性操作来批量处理节点。
实现
跳跃表节点
//跳跃表节点
typedef struct zskiplistNode {
// 成员对象
robj *obj;
// 分值
double score;
// 后退指针: 指向位于当前节点的前一个节点。在程序从表尾向表头遍历时使用。
struct zskiplistNode *backward;
// 层
struct zskiplistLevel {
// 前进指针:访问表尾方向的其他节点
struct zskiplistNode *forward;
// 跨度:记录了前进指针所指向节点和当前节点的距离
unsigned int span;
} level[];
} zskiplistNode;
// 跳跃表
typedef struct zskiplist {
// 指向跳跃表的表头节点和表尾节点
struct zskiplistNode *header, *tail;
// 记录跳跃表的长度
unsigned long length;
// 记录跳跃表内,层数最大的那个节点的层数(表头节点的层数不计算在内)
int level;
} zskiplist;
- 层
跳跃表节点的level数组可以包含多个元素,每个元素都包含一个指向其他节点的指针,程序可以通过这些层来加快访问其他节点的速度,一般来说,层的数量越多,访问其他节点的速度越快。
每次创建一个新跳跃表节点的时候,程序都根据幂次(越大的书出现的概率越小)随机生成一个介于1和32之间的值作为level数组的大小,这个大小就是层的“高度”。 - 前进指针
每个层都有一个指向表尾方向的前进指针,用于从表头向表尾方向访问节点。 - 跨度
层的跨度用于记录两个节点之间的距离,用来计算排位:在查找某个节点的过程中,将沿途访问过的所有层的跨度累计起来,就可得目标节点在跳跃表中的排位。 - 后退指针
节点的后退指针用来从表尾向表头方向访问节点。 - 分值和成员
节点的分值是一个double类型,跳跃表中的所有节点都按分值大小从小到大来排序。
节点的成员对象(obj属性)是一个指针,它指向一个字符串对象,而字符串对象则保存着一个SDS值。
在同一个跳跃表中,各个节点保存的成员对象必须是唯一的,但是多个节点保存的分值可以是相同的:分值相同的节点将按照成员对象在字典序中的大小来进行排序,成员对象较小的节点会排在前面,而成员对象较大的节点会排在后面。
应用场景
实现有序集合键方法之一,在集群节点中用作内部数据结构。
如果一个有序集合包含的元素数量比较多,又或者有序集合中的元素的成员是比较长的字符串时,Redis就会使用跳跃表作为有序集合键的底层实现。
参考
《Redis设计与实现》