1. 简介
-
对于数组来说:如果数组是有序的,则搜索操作可以使用二分搜索法,其时间复杂度为 O ( log n ) O(\log n) O(logn);但插入和删除操作的时间复杂度则需要 O ( n ) O(n) O(n)。
-
对于链表来说:即使链表是有序的,其搜索操作也无法使用二分搜索法,只能进行顺序查找,时间复杂度为 O ( n ) O(n) O(n);但其插入和删除操作具有 O ( 1 ) O(1) O(1) 的时间复杂度。
-
为了兼顾搜索、插入和删除操作的效率,平衡搜索树被提出。但无论是 AVL 树还是红黑树,其实现都较为复杂。
-
跳跃表的实现更为简单,且能够更好地支持范围查询。跳跃表中的元素是有序的,其搜索、插入和删除操作都具有 O ( log n ) O(\log n) O(logn) 的时间复杂度,且实现更加简单、易维护,具有 O ( n ) O(n) O(n) 的空间复杂度。
2. 思想
跳跃表的基本思想便是“分层”:跳跃表由多层链表堆叠而成,每层都是一个链表,且处于不同层次的链表的跨度有所不同。处于最底层的链表就是普通的链表,其跨度为 1 1 1。从纵向来看,处于不同层次、具有相同关键码的节点堆叠成“塔”,每个塔实际上又是一个链表。
跳跃表的总体结构如下图所示(每一层、每一个塔可以是双链表)。
3. 搜索
假设要搜索的关键码为 k k k。
(1)从第一个塔的最顶层开始;
(2)从前往后找,只要当前节点的关键码小于
k
k
k,就继续向前进一步;否则,
(3)如果当前节点的关键码等于
k
k
k,则命中返回;否则,
(4)如果当前节点的关键码大于
k
k
k,则往后回退一步,然后于当前塔中,向下一步;
(5)如果“穿透”了最底层,则失败返回,否则继续回到步骤(2)执行。
4. 插入
假设跳跃表的高度为 h h h,关键码总数为 n n n,如果每一层链表的长度(跨度)都一样,则跳跃表的空间复杂度为 O ( h n ) O(hn) O(hn)。
为了避免 O ( h n ) O(hn) O(hn) 的空间复杂度,跳跃表使用了“生长概率逐层减半”的增长策略:对于某一个塔来说,第 i i i 层中的节点在第 i + 1 i+1 i+1 层中继续出现(保持生长)的概率为 1 2 \frac{1}{2} 21。跳跃表通过此策略将其空间复杂度控制为 O ( n ) O(n) O(n)。
假设待插入的关键码为 k k k(此处以 k = 4 k=4 k=4 为例)、记录为 v v v。
(1)首先使用上述搜索方法定位
k
k
k 在跳跃表中的位置,设该位置为
p
p
p;
(2)如果
p
p
p 所指节点的关键码等于
k
k
k,则首先往下移动至塔的最底层,然后自底向上更新
k
k
k 所关联的记录,接着成功返回;
(3)否则,
p
p
p 应当指向跳跃表最底层中、最后一个关键码小于
k
k
k 的节点(此处
p
=
3
p=3
p=3);
(4)在
p
p
p 之后插入一个新的节点
x
x
x,并存储
(
k
,
v
)
(k,v)
(k,v);
(5)接着通过“抛硬币”(可以通过生成随机数来进行决策)来决定是否继续向上增长
x
x
x 所在的塔;若为否,则成功返回;否则,设当前处于第
i
i
i 层(初始为
1
1
1);
(6)向上增长
x
x
x 所在的塔一个单位(第
i
+
1
i+1
i+1 层),然后于第
i
i
i 层中进行回溯,找到第一个高度不低于
i
+
1
i+1
i+1 的节点
y
y
y,设
y
y
y 的后继节点为
z
z
z;
(7)如果找不到
y
y
y,即意味着到达了第一个塔,此时需要将第一个和最后一个塔往上增长一层,并进行链接;
(8)于第
i
+
1
i+1
i+1 层上,将
x
x
x 插入
y
,
z
y,z
y,z 之间(更新
x
,
y
,
z
x,y,z
x,y,z 之间的指针指向);然后返回步骤(5)。
跳跃表的插入操作的时间复杂度为 O ( log n ) O(\log n) O(logn)。
5. 删除
假设待删除的关键码为 k k k。
(1)首先使用上述搜索方法定位
k
k
k 在跳跃表中的位置,设该位置为
p
p
p;
(2)如果
p
p
p 所指节点的关键码不等于
k
k
k,则失败返回;否则,
(3)逐层删除
p
p
p 所指向的塔,并相应地更新指针指向。
跳跃表的删除操作的时间复杂度为 O ( log n ) O(\log n) O(logn)。