1 跳表
- 一个有序链表搜索、添加、删除的平均时间复杂度是多少?
- 数组查找的时间复杂度可以达到O(logn)是因为数组支持随机访问,对于有序的数组,可以通过二分查找,达到O(logn)的效率
- 能否利用二分搜索优化有序链表,将搜索、添加、删除的平均时间复杂度降低至 O(logn)?
- 链表没有像数组那样的高效随机访问(O(1) 时间复杂度),所以不能像有序数组那样直接进行二分搜索优化
- 那有没有其他办法让有序链表搜索、添加、删除的平均时间复杂度降低至 O(logn)?
- 使用跳表(SkipList)
- 跳表,又叫做跳跃表、跳跃列表,在有序链表的基础上增加了“跳跃”的功能。设计的初衷是为了取代平衡树(比如红黑树),跳表类似TreeMap,都存放key-value
- Redis中 的 SortedSet、LevelDB 中的 MemTable 都用到了跳表
- 对比平衡树
- 跳表的实现和维护会更加简单
- 跳表的搜索、删除、添加的平均时间复杂度是 O(logn)
- 使用跳表优化链表
- 跳表的搜索
- 从顶层链表的首元素开始,从左往右搜索,直至找到一个大于或等于目标的元素,或者到达当前层链表的尾部
- 如果该元素等于目标元素,则表明该元素已被找到
- 如果该元素大于目标元素或已到达链表的尾部,则退回到当前层的前一个元素,然后转入下一层进行搜索
- 跳表的添加、删除
- 本质就是在搜索的基础上,建立一个数组,存放要添加或删除的节点的所有层的前驱节点
- 新添加节点的层数,是随机以一定规则获得的
- 最后还需要考虑层数的更新
- 跳表的层数
- 跳表是按层构造的,底层是一个普通的有序链表,高层相当于是低层的“快速通道”
- 在第 i 层中的元素按某个固定的概率 p(通常为 ½ 或 ¼ )出现在第 i + 1层中,产生越高的层数,概率越低
- 元素层数恰好等于 1 的概率为 1 – p
- 元素层数大于等于 2 的概率为 p,而元素层数恰好等于 2 的概率为 p * (1 – p)
- 元素层数大于等于 3 的概率为 p^2,而元素层数恰好等于 3 的概率为 (p ^2) * (1 – p)
- 将这些概率加和,除以层数,得到一个元素的平均层数是 1 / (1 – p)
- 当 p = ½ 时,每个元素所包含的平均指针数量是 2
- 当 p = ¼ 时,每个元素所包含的平均指针数量是 1.33
- 跳表中的指针数指的就是nexts数组中元素个数,而红黑树每个节点上指针至少是三个,next、parent、right,因此当p=1/4可以发现,其空间复杂度要好于红黑树
- 跳表的复杂度分析
- 每一层的元素数量
- 第 1 层链表固定有 n 个元素(最底层,一定是和总元素个数相同)
- 第 2 层链表平均有 n * p 个元素
- 第 3 层链表平均有 n * p^2 个元素
- 第 k 层链表平均有 n * p^k 个元素
- 跳表最高有 log (1/p) (n)层,搜索时,每一层链表的预期查找步数最多是 1/p
- 所以,如果p是1/4,那么总的查找步数是最高层数*每层最多步数,即log4(n)/4,
- 因此时间复杂度为O(logn)
- SkipList
package com.mj;
import java.util.Comparator;
@SuppressWarnings("unchecked")
public class SkipList<K, V> {
private static final int MAX_LEVEL = 32;
private static final double P = 0.25;
private int size;
private Comparator<K> comparator;
private int level;
private Node<K, V> first;
public SkipList(Comparator<K> comparator) {
this.comparator = comparator;
first = new Node<>(null, null, MAX_LEVEL);
}
public SkipList() {
this(null);
}
public int size() {
return size;
}
public boolean isEmpty() {
return size == 0