【恋上数据结构】跳表（Skip List）原理及实现

最新推荐文章于 2024-02-25 12:22:17 发布

萌宅鹿同学

最新推荐文章于 2024-02-25 12:22:17 发布

阅读量759

点赞数

分类专栏： # 《恋上数据结构》文章标签：链表数据结构列表算法跳表

本文链接：https://blog.csdn.net/weixin_43734095/article/details/105780061

版权

《恋上数据结构》专栏收录该内容

40 篇文章 129 订阅

订阅专栏

跳表（Skip List）

引出跳表
跳表介绍
跳表原理及实现
跳表的层数
跳表的复杂度分析
跳表 - 完整源码

数据结构与算法笔记：恋上数据结构笔记目录

引出跳表

一个有序链表搜索、添加、删除的平均时间复杂度是多少？

O(n)

能否利用二分搜索优化有序链表，将搜索、添加、删除的平均时间复杂度降低至 O(logn)？

链表没有像数组那样的高效随机访问（O(1) 时间复杂度），所以不能像有序数组那样直接进行二分搜索优化

有没有其他办法让有序链表搜索、添加、删除的平均时间复杂度降低至 O(logn)？

跳表（SkipList）

跳表介绍

跳表，又叫做跳跃表、跳跃列表，在有序链表的基础上增加了“跳跃”的功能

由 William Pugh 于1990年发布，设计的初衷是为了取代平衡树（比如红黑树）

Redis 中的 SortedSet、LevelDB 中的 MemTable 都用到了跳表

Redis、LevelDB 都是著名的 Key-Value数据库

对比平衡树：

跳表的实现和维护会更加简单
跳表的搜索、删除、添加的平均时间复杂度是 O(logn)（与红黑树相同）

跳表原理及实现

使用跳表优化链表

普通链表：
在这里插入图片描述
有效层数为 2 的跳表：

有效层数为 4 的跳表：

跳表基础结构

/**
 * 跳表
 * @author yusael
 */
@SuppressWarnings("unchecked")
public class SkipList <K, V> {
	private static final double P = 0.25; // 仿照Redis的做法, 维护一个概率值
	private static final int MAX_LEVEL = 32; // 最高层数
	private int size;
	private Comparator<K> comparator;
	/**
	 * 有效层数
	 */
	private int level;
	/**
	 * 不存放任何 K-V 的虚拟头节点
	 */
	private Node<K, V> first; 
	
	public SkipList(Comparator<K> comparator) {
		this.comparator = comparator;
		// 头节点的高度必须是跳表的最高层数(非有效层数), 为了后面插入新节点做准备
		first = new Node<>(null, null, MAX_LEVEL);
	}
	
	private int compare(K k1, K k2) {
		return comparator != null
				? comparator.compare(k1, k2)
				: ((Comparable<K>)k1).compareTo(k2);
	}

	private static class Node<K, V> {
		K key;
		V value;
		Node<K, V>[] nexts; // 该节点的不同层指向的下一节点
		// 拿上面的四层跳表的图来举例
		// first.next[3] == 21节点
		// first.next[2] == 9节点
		// first.next[1] == 6节点
		// first.next[0] == 3节点
		public Node(K key, V value, int level) {
			this.key = key;
			this.value = value;
			nexts = new Node[level];
		}
	}

}

跳表的搜索

① 从顶层链表的首元素开始，从左往右搜索，直至找到一个大于或等于目标的元素，或者到达当前层链表的尾部
② 如果该元素等于目标元素，则表明该元素已被找到
③ 如果该元素大于目标元素或已到达链表的尾部，则退回到当前层的前一个元素，然后转入下一层进行搜索

public V get(K key) {
	keyCheck(key);
	
	Node<K, V> node = first;
	for (int i = level - 1; i >= 0 ; i--) {
		int cmp = -1;
		while (node.nexts[i] != null 
				&& (cmp = compare(key, node.nexts[i].key)) > 0) {
			node = node.nexts[i];
		}
		// node.nexts[i].key >= key
		if (cmp == 0) return node.nexts[i].value;
	}
	return null;
}

跳表的添加、删除

在这里插入图片描述
添加的细节：随机决定新添加元素的层数（官方建议）

/**
 * 跳表中加入新结点时的层数随机
 * @return
 */
private int randomLevel() {
	int level = 1; 
	while (Math.random() < P && level < MAX_LEVEL) { // 每次有25%的概率+1层
		level++;
	}
	return level;
}

public V put(K key, V value) {
	keyCheck(key);
	
	Node<K, V> node = first;
	// 前驱节点, 插入节点时要用到, 获取了前驱就相当于获取了后继
	Node<K, V>[] prevs = new Node[level];
	for (int i = level - 1; i >= 0 ; i--) {
		int cmp = -1;
		while (node.nexts[i] != null 
				&& (cmp = compare(key, node.nexts[i].key)) > 0) {
			node = node.nexts[i];
		}
		// node.nexts[i].key >= key
		if (cmp == 0) { // 节点原本就存在
			V oldV = node.nexts[i].value;
			node.nexts[i].value = value;
			return oldV;
		}
		prevs[i] = node; // 保存前驱节点
	}
		
	// 新节点的层数(随机)
	int newLevel = randomLevel();
	// 添加新节点
	Node<K, V> newNode = new Node<>(key, value, newLevel);
	// 设置新节点的前驱和后继(获取了前驱就相当于获取了后继)
	for (int i = 0; i < newLevel; i++) {
		if (i >= level) { // 新节点的层数比有效层数高
			// 头结点成为新节点的前驱
			first.nexts[i] = newNode; // 让头节点指向新节点(头节点创建时是最高层)
			// 后继结点默认指向null
		} else { // 新节点的层数比有效层数低
			newNode.nexts[i] = prevs[i].nexts[i]; // 让新节点的后继节点指向(之前的)前驱的后继
			prevs[i].nexts[i] = newNode; // 让前驱节点指向新节点
		}
	}
	level = Math.max(level, newLevel); // 计算跳表的最终层数(更新有效层数)
	size++; // 节点数量增加
	return null; // 之前不存在该节点, 返回null
}

删除的细节：删除一个元素后，整个跳表的层数可能会降低

public V remove(K key) {
	keyCheck(key);
	Node<K, V> node = first;
	Node<K, V>[] prevs = new Node[level];
	boolean exist = false; // 判断是否有该节点
	for (int i = level - 1; i >= 0; i--) {
		int cmp = -1;
		while (node.nexts[i] != null 
				&& (cmp = compare(key, node.nexts[i].key)) > 0) {
			node = node.nexts[i];
		}
		// key <= node.nexts[i].key 
		if (cmp == 0) exist = true; // 存在
		prevs[i] = node; // 保存前驱节点
	}
	if (!exist) return null; // 跳表中没有该元素, 无需删除
	
	// 需要被删除的节点
	// 此时该元素必然存在, 且node必然为最下面一层, 该元素的前驱节点 
	Node<K, V> removedNode = node.nexts[0];
	
	// 设置后继
	for (int i = 0 ; i < removedNode.nexts.length; i++) {
		prevs[i].nexts[i] = removedNode.nexts[i];
	}
	// 更新跳表的层数
	int newLevel = level;
	while (--newLevel > 0 && first.nexts[newLevel] == null) {
		level = newLevel;
	}
	size--; // 数量减少
	return removedNode.value;	 
}

跳表的层数

在这里插入图片描述

跳表的复杂度分析

每一层的元素数量：从下往上

第 1 层链表固定有 n 个元素
第 2 层链表平均有 n * p 个元素
第 3 层链表平均有 n * p^2 个元素
第 k 层链表平均有 n * p^k 个元素
……

最高层的层数是 log_1/p n，平均有个 1/p 元素

在搜索时，每一层链表的预期查找步数最多是 1/p

所以总的查找步数是 -(log_p n/p)
时间复杂度是 O(logn)

跳表 - 完整源码

package com.mj;

import java.util.Comparator;

/**
 * 跳表
 * @author yusael
 */
@SuppressWarnings("unchecked")
public class SkipList <K, V> {
	private static final double P = 0.25; // 仿照Redis的做法, 维护一个概率值
	private static final int MAX_LEVEL = 32; // 最高层数
	private int size;
	private Comparator<K> comparator;
	/**
	 * 有效层数
	 */
	private int level;
	/**
	 * 不存放任何 K-V 的虚拟头结点
	 */
	private Node<K, V> first; 
	
	public SkipList(Comparator<K> comparator) {
		this.comparator = comparator;
		first = new Node<>(null, null, MAX_LEVEL);
	}
	
	public SkipList() {
		this(null);
	}
	
	public int size() {
		return size;
	}
	
	public boolean isEmpty() {
		return size == 0;
	}
	
	public V put(K key, V value) {
		keyCheck(key);
		
		Node<K, V> node = first;
		// 前驱节点, 插入节点时要用到, 获取了前驱就相当于获取了后继
		Node<K, V>[] prevs = new Node[level];
		for (int i = level - 1; i >= 0 ; i--) {
			int cmp = -1;
			while (node.nexts[i] != null 
					&& (cmp = compare(key, node.nexts[i].key)) > 0) {
				node = node.nexts[i];
			}
			// node.nexts[i].key >= key
			if (cmp == 0) { // 节点原本就存在
				V oldV = node.nexts[i].value;
				node.nexts[i].value = value;
				return oldV;
			}
			prevs[i] = node; // 保存前驱节点
		}
			
		// 新节点的层数(随机)
		int newLevel = randomLevel();
		// 添加新节点
		Node<K, V> newNode = new Node<>(key, value, newLevel);
		// 设置新节点的前驱和后继(获取了前驱就相当于获取了后继)
		for (int i = 0; i < newLevel; i++) {
			if (i >= level) { // 新节点的层数比有效层数高
				// 头结点成为新节点的前驱
				first.nexts[i] = newNode; // 让头节点指向新节点(头节点创建时是最高层)
				// 后继结点默认指向null
			} else { // 新节点的层数比有效层数低
				newNode.nexts[i] = prevs[i].nexts[i]; // 让新节点的后继节点指向(之前的)前驱的后继
				prevs[i].nexts[i] = newNode; // 让前驱节点指向新节点
			}
		}
		level = Math.max(level, newLevel); // 计算跳表的最终层数(更新有效层数)
		size++; // 节点数量增加
		return null; // 之前不存在该节点, 返回null
	}
	
	public V get(K key) {
		keyCheck(key);
		
		// first.next[3] == 21节点
		// first.next[2] == 9节点
		// first.next[1] == 6节点
		// first.next[0] == 3节点

		Node<K, V> node = first;
		for (int i = level - 1; i >= 0 ; i--) {
			int cmp = -1;
			while (node.nexts[i] != null 
					&& (cmp = compare(key, node.nexts[i].key)) > 0) {
				node = node.nexts[i];
			}
			// node.nexts[i].key >= key
			if (cmp == 0) return node.nexts[i].value;
		}
		return null;
	}
	
	public V remove(K key) {
		keyCheck(key);
		Node<K, V> node = first;
		Node<K, V>[] prevs = new Node[level];
		boolean exist = false; // 判断是否有该节点
		for (int i = level - 1; i >= 0; i--) {
			int cmp = -1;
			while (node.nexts[i] != null 
					&& (cmp = compare(key, node.nexts[i].key)) > 0) {
				node = node.nexts[i];
			}
			// key <= node.nexts[i].key 
			if (cmp == 0) exist = true; // 存在
			prevs[i] = node; // 保存前驱节点
		}
		if (!exist) return null; // 跳表中没有该元素, 无需删除
		
		// 需要被删除的节点
		// 此时该元素必然存在, 且node必然为最下面一层, 该元素的前驱节点 
		Node<K, V> removedNode = node.nexts[0];
		
		// 设置后继
		for (int i = 0 ; i < removedNode.nexts.length; i++) {
			prevs[i].nexts[i] = removedNode.nexts[i];
		}
		// 更新跳表的层数
		int newLevel = level;
		while (--newLevel > 0 && first.nexts[newLevel] == null) {
			level = newLevel;
		}
		size--; // 数量减少
		return removedNode.value;
	}
	
	/**
	 * 跳表中加入新结点时的层数随机
	 * @return
	 */
	private int randomLevel() {
		int level = 1; 
		while (Math.random() < P && level < MAX_LEVEL) { // 每次有25%的概率+1层
			level++;
		}
		return level;
	}
	
	private void keyCheck(K key) {
		if (key == null) {
			throw new IllegalArgumentException("key must not be null.");
		}
	}
	
	private int compare(K k1, K k2) {
		return comparator != null
				? comparator.compare(k1, k2)
				: ((Comparable<K>)k1).compareTo(k2);
	}

	private static class Node<K, V> {
		K key;
		V value;
		Node<K, V>[] nexts;
		public Node(K key, V value, int level) {
			this.key = key;
			this.value = value;
			nexts = new Node[level];
		}
		@Override
		public String toString() {
			return key + ":" + value + "_" + nexts.length;
		}
	}
	
	@Override
	public String toString() {
		StringBuilder sb = new StringBuilder();
		sb.append("一共" + level + "层").append("\n");
		for (int i = level - 1; i >= 0; i--) {
			Node<K, V> node = first;
			while (node.nexts[i] != null) {
				sb.append(node.nexts[i]);
				sb.append("\t");
				node = node.nexts[i];
			}
			sb.append("\n");
		}
		return sb.toString();
	}
}

测试代码：

package com.mj;

import java.util.TreeMap;
import com.mj.tool.Asserts;
import com.mj.tool.Times;

public class Main {
	public static void main(String[] args) {
//		SkipList<Integer, Integer> list = new SkipList<>();
//		test(list, 10, 10);
		time();
	}
	private static void time() {
		TreeMap<Integer, Integer> map = new TreeMap<>();
		SkipList<Integer, Integer> list = new SkipList<>();
		int count = 100_0000;
		int delta = 10;
		
		Times.test("SkipList", () -> {
			test(list, count, delta);
		});
		
		System.out.println("-----------------------");
		
		Times.test("TreeMap", () -> {
			test(map, count, delta);
		});
	}
	
	public static void test(SkipList<Integer, Integer> list, int count, int delta) {
		for (int i = 0; i < count; i++) {
			list.put(i, i + delta);
		}
//		System.out.println(list);
		for (int i = 0; i < count; i++) {
			Asserts.test(list.get(i) == i + delta);
		}
		Asserts.test(list.size() == count);
		for (int i = 0; i < count; i++) {
			Asserts.test(list.remove(i) == i + delta);
		}
		Asserts.test(list.size() == 0);
	}
	
	private static void test(TreeMap<Integer, Integer> map, int count, int delta) {
		for (int i = 0; i < count; i++) {
			map.put(i, i + delta);
		}
		for (int i = 0; i < count; i++) {
			Asserts.test(map.get(i) == i + delta);
		}
		Asserts.test(map.size() == count);
		for (int i = 0; i < count; i++) {
			Asserts.test(map.remove(i) == i + delta);
		}
		Asserts.test(map.size() == 0);
	}
	
}

一共4层
19:29_4	
4:14_3	19:29_4	
3:13_2	4:14_3	7:17_2	9:19_2	19:29_4	
0:10_1	1:11_1	2:12_1	3:13_2	4:14_3	5:15_1	6:16_1	7:17_2	8:18_1	9:19_2	10:20_1	11:21_1	12:22_1	13:23_1	14:24_1	15:25_1	16:26_1	17:27_1	18:28_1	19:29_4

【SkipList】
耗时：0.451s(451.0ms)
-------------------------------------
【TreeMap】
耗时：0.383s(383.0ms)
-------------------------------------

萌宅鹿同学

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
【恋上数据结构】跳表（Skip List）原理及实现

跳表（Skip List）引出跳表跳表介绍跳表原理及实现使用跳表优化链表跳表基础结构跳表的搜索跳表的添加、删除跳表的层数跳表的复杂度分析跳表 - 完整源码数据结构与算法笔记：恋上数据结构笔记目录引出跳表一个有序链表搜索、添加、删除的平均时间复杂度是多少？O(n)能否利用二分搜索优化有序链表，将搜索、添加、删除的平均时间复杂度降低至 O(logn)？链表没有像数组那样的高效随...
复制链接

扫一扫