【恋上数据结构】跳表(Skip List)原理及实现

数据结构与算法笔记恋上数据结构笔记目录

引出跳表

一个有序链表搜索、添加、删除的平均时间复杂度是多少?

  • O(n)
    在这里插入图片描述

能否利用二分搜索优化有序链表,将搜索、添加、删除的平均时间复杂度降低至 O(logn)?

  • 链表没有像数组那样的高效随机访问(O(1) 时间复杂度),所以不能像有序数组那样直接进行二分搜索优化

有没有其他办法让有序链表搜索、添加、删除的平均时间复杂度降低至 O(logn)

  • 跳表(SkipList)

跳表介绍

跳表,又叫做跳跃表跳跃列表,在有序链表的基础上增加了“跳跃”的功能

  • 由 William Pugh 于1990年发布,设计的初衷是为了取代平衡树(比如红黑树

Redis 中 的 SortedSetLevelDB 中的 MemTable 都用到了跳表

  • Redis、LevelDB 都是著名的 Key-Value数据库

对比平衡树:

  • 跳表的实现和维护会更加简单
  • 跳表的搜索、删除、添加的平均时间复杂度是 O(logn)(与红黑树相同)

跳表原理及实现

使用跳表优化链表

普通链表:
在这里插入图片描述
有效层数为 2 的跳表:
在这里插入图片描述
有效层数为 4 的跳表:
在这里插入图片描述

跳表基础结构

/**
 * 跳表
 * @author yusael
 */
@SuppressWarnings("unchecked")
public class SkipList <K, V> {
	private static final double P = 0.25; // 仿照Redis的做法, 维护一个概率值
	private static final int MAX_LEVEL = 32; // 最高层数
	private int size;
	private Comparator<K> comparator;
	/**
	 * 有效层数
	 */
	private int level;
	/**
	 * 不存放任何 K-V 的虚拟头节点
	 */
	private Node<K, V> first; 
	
	public SkipList(Comparator<K> comparator) {
		this.comparator = comparator;
		// 头节点的高度必须是跳表的最高层数(非有效层数), 为了后面插入新节点做准备
		first = new Node<>(null, null, MAX_LEVEL);
	}
	
	private int compare(K k1, K k2) {
		return comparator != null
				? comparator.compare(k1, k2)
				: ((Comparable<K>)k1).compareTo(k2);
	}

	private static class Node<K, V> {
		K key;
		V value;
		Node<K, V>[] nexts; // 该节点的不同层指向的下一节点
		// 拿上面的四层跳表的图来举例
		// first.next[3] == 21节点
		// first.next[2] == 9节点
		// first.next[1] == 6节点
		// first.next[0] == 3节点
		public Node(K key, V value, int level) {
			this.key = key;
			this.value = value;
			nexts = new Node[level];
		}
	}

}

跳表的搜索

① 从顶层链表的首元素开始,从左往右搜索,直至找到一个大于或等于目标的元素,或者到达当前层链表的尾部
② 如果该元素等于目标元素,则表明该元素已被找到
③ 如果该元素大于目标元素或已到达链表的尾部,则退回到当前层的前一个元素,然后转入下一层进行搜索

public V get(K key) {
	keyCheck(key);
	
	Node<K, V> node = first;
	for (int i = level - 1; i >= 0 ; i--) {
		int cmp = -1;
		while (node.nexts[i] != null 
				&& (cmp = compare(key, node.nexts[i].key)) > 0) {
			node = node.nexts[i];
		}
		// node.nexts[i].key >= key
		if (cmp == 0) return node.nexts[i].value;
	}
	return null;
}

跳表的添加、删除

在这里插入图片描述
添加的细节:随机决定新添加元素的层数(官方建议)

/**
 * 跳表中加入新结点时的层数随机
 * @return
 */
private int randomLevel() {
	int level = 1; 
	while (Math.random() < P && level < MAX_LEVEL) { // 每次有25%的概率+1层
		level++;
	}
	return level;
}

public V put(K key, V value) {
	keyCheck(key);
	
	Node<K, V> node = first;
	// 前驱节点, 插入节点时要用到, 获取了前驱就相当于获取了后继
	Node<K, V>[] prevs = new Node[level];
	for (int i = level - 1; i >= 0 ; i--) {
		int cmp = -1;
		while (node.nexts[i] != null 
				&& (cmp = compare(key, node.nexts[i].key)) > 0) {
			node = node.nexts[i];
		}
		// node.nexts[i].key >= key
		if (cmp == 0) { // 节点原本就存在
			V oldV = node.nexts[i].value;
			node.nexts[i].value = value;
			return oldV;
		}
		prevs[i] = node; // 保存前驱节点
	}
		
	// 新节点的层数(随机)
	int newLevel = randomLevel();
	// 添加新节点
	Node<K, V> newNode = new Node<>(key, value, newLevel);
	// 设置新节点的前驱和后继(获取了前驱就相当于获取了后继)
	for (int i = 0; i < newLevel; i++) {
		if (i >= level) { // 新节点的层数比有效层数高
			// 头结点成为新节点的前驱
			first.nexts[i] = newNode; // 让头节点指向新节点(头节点创建时是最高层)
			// 后继结点默认指向null
		} else { // 新节点的层数比有效层数低
			newNode.nexts[i] = prevs[i].nexts[i]; // 让新节点的后继节点指向(之前的)前驱的后继
			prevs[i].nexts[i] = newNode; // 让前驱节点指向新节点
		}
	}
	level = Math.max(level, newLevel); // 计算跳表的最终层数(更新有效层数)
	size++; // 节点数量增加
	return null; // 之前不存在该节点, 返回null
}

删除的细节:删除一个元素后,整个跳表的层数可能会降低

public V remove(K key) {
	keyCheck(key);
	Node<K, V> node = first;
	Node<K, V>[] prevs = new Node[level];
	boolean exist = false; // 判断是否有该节点
	for (int i = level - 1; i >= 0; i--) {
		int cmp = -1;
		while (node.nexts[i] != null 
				&& (cmp = compare(key, node.nexts[i].key)) > 0) {
			node = node.nexts[i];
		}
		// key <= node.nexts[i].key 
		if (cmp == 0) exist = true; // 存在
		prevs[i] = node; // 保存前驱节点
	}
	if (!exist) return null; // 跳表中没有该元素, 无需删除
	
	// 需要被删除的节点
	// 此时该元素必然存在, 且node必然为最下面一层, 该元素的前驱节点 
	Node<K, V> removedNode = node.nexts[0];
	
	// 设置后继
	for (int i = 0 ; i < removedNode.nexts.length; i++) {
		prevs[i].nexts[i] = removedNode.nexts[i];
	}
	// 更新跳表的层数
	int newLevel = level;
	while (--newLevel > 0 && first.nexts[newLevel] == null) {
		level = newLevel;
	}
	size--; // 数量减少
	return removedNode.value;	 
}

跳表的层数

在这里插入图片描述

跳表的复杂度分析

每一层的元素数量:从下往上

  • 第 1 层链表固定有 n 个元素
  • 第 2 层链表平均有 n * p 个元素
  • 第 3 层链表平均有 n * p^2 个元素
  • 第 k 层链表平均有 n * p^k 个元素
  • ……

最高层的层数是 log1/p n,平均有个 1/p 元素

在搜索时,每一层链表的预期查找步数最多是 1/p

  • 所以总的查找步数是 -(logp n/p)
  • 时间复杂度是 O(logn)

跳表 - 完整源码

package com.mj;

import java.util.Comparator;

/**
 * 跳表
 * @author yusael
 */
@SuppressWarnings("unchecked")
public class SkipList <K, V> {
	private static final double P = 0.25; // 仿照Redis的做法, 维护一个概率值
	private static final int MAX_LEVEL = 32; // 最高层数
	private int size;
	private Comparator<K> comparator;
	/**
	 * 有效层数
	 */
	private int level;
	/**
	 * 不存放任何 K-V 的虚拟头结点
	 */
	private Node<K, V> first; 
	
	public SkipList(Comparator<K> comparator) {
		this.comparator = comparator;
		first = new Node<>(null, null, MAX_LEVEL);
	}
	
	public SkipList() {
		this(null);
	}
	
	public int size() {
		return size;
	}
	
	public boolean isEmpty() {
		return size == 0;
	}
	
	public V put(K key, V value) {
		keyCheck(key);
		
		Node<K, V> node = first;
		// 前驱节点, 插入节点时要用到, 获取了前驱就相当于获取了后继
		Node<K, V>[] prevs = new Node[level];
		for (int i = level - 1; i >= 0 ; i--) {
			int cmp = -1;
			while (node.nexts[i] != null 
					&& (cmp = compare(key, node.nexts[i].key)) > 0) {
				node = node.nexts[i];
			}
			// node.nexts[i].key >= key
			if (cmp == 0) { // 节点原本就存在
				V oldV = node.nexts[i].value;
				node.nexts[i].value = value;
				return oldV;
			}
			prevs[i] = node; // 保存前驱节点
		}
			
		// 新节点的层数(随机)
		int newLevel = randomLevel();
		// 添加新节点
		Node<K, V> newNode = new Node<>(key, value, newLevel);
		// 设置新节点的前驱和后继(获取了前驱就相当于获取了后继)
		for (int i = 0; i < newLevel; i++) {
			if (i >= level) { // 新节点的层数比有效层数高
				// 头结点成为新节点的前驱
				first.nexts[i] = newNode; // 让头节点指向新节点(头节点创建时是最高层)
				// 后继结点默认指向null
			} else { // 新节点的层数比有效层数低
				newNode.nexts[i] = prevs[i].nexts[i]; // 让新节点的后继节点指向(之前的)前驱的后继
				prevs[i].nexts[i] = newNode; // 让前驱节点指向新节点
			}
		}
		level = Math.max(level, newLevel); // 计算跳表的最终层数(更新有效层数)
		size++; // 节点数量增加
		return null; // 之前不存在该节点, 返回null
	}
	
	public V get(K key) {
		keyCheck(key);
		
		// first.next[3] == 21节点
		// first.next[2] == 9节点
		// first.next[1] == 6节点
		// first.next[0] == 3节点

		Node<K, V> node = first;
		for (int i = level - 1; i >= 0 ; i--) {
			int cmp = -1;
			while (node.nexts[i] != null 
					&& (cmp = compare(key, node.nexts[i].key)) > 0) {
				node = node.nexts[i];
			}
			// node.nexts[i].key >= key
			if (cmp == 0) return node.nexts[i].value;
		}
		return null;
	}
	
	public V remove(K key) {
		keyCheck(key);
		Node<K, V> node = first;
		Node<K, V>[] prevs = new Node[level];
		boolean exist = false; // 判断是否有该节点
		for (int i = level - 1; i >= 0; i--) {
			int cmp = -1;
			while (node.nexts[i] != null 
					&& (cmp = compare(key, node.nexts[i].key)) > 0) {
				node = node.nexts[i];
			}
			// key <= node.nexts[i].key 
			if (cmp == 0) exist = true; // 存在
			prevs[i] = node; // 保存前驱节点
		}
		if (!exist) return null; // 跳表中没有该元素, 无需删除
		
		// 需要被删除的节点
		// 此时该元素必然存在, 且node必然为最下面一层, 该元素的前驱节点 
		Node<K, V> removedNode = node.nexts[0];
		
		// 设置后继
		for (int i = 0 ; i < removedNode.nexts.length; i++) {
			prevs[i].nexts[i] = removedNode.nexts[i];
		}
		// 更新跳表的层数
		int newLevel = level;
		while (--newLevel > 0 && first.nexts[newLevel] == null) {
			level = newLevel;
		}
		size--; // 数量减少
		return removedNode.value;
	}
	
	/**
	 * 跳表中加入新结点时的层数随机
	 * @return
	 */
	private int randomLevel() {
		int level = 1; 
		while (Math.random() < P && level < MAX_LEVEL) { // 每次有25%的概率+1层
			level++;
		}
		return level;
	}
	
	private void keyCheck(K key) {
		if (key == null) {
			throw new IllegalArgumentException("key must not be null.");
		}
	}
	
	private int compare(K k1, K k2) {
		return comparator != null
				? comparator.compare(k1, k2)
				: ((Comparable<K>)k1).compareTo(k2);
	}

	private static class Node<K, V> {
		K key;
		V value;
		Node<K, V>[] nexts;
		public Node(K key, V value, int level) {
			this.key = key;
			this.value = value;
			nexts = new Node[level];
		}
		@Override
		public String toString() {
			return key + ":" + value + "_" + nexts.length;
		}
	}
	
	@Override
	public String toString() {
		StringBuilder sb = new StringBuilder();
		sb.append("一共" + level + "层").append("\n");
		for (int i = level - 1; i >= 0; i--) {
			Node<K, V> node = first;
			while (node.nexts[i] != null) {
				sb.append(node.nexts[i]);
				sb.append("\t");
				node = node.nexts[i];
			}
			sb.append("\n");
		}
		return sb.toString();
	}
}

测试代码:

package com.mj;

import java.util.TreeMap;
import com.mj.tool.Asserts;
import com.mj.tool.Times;

public class Main {
	public static void main(String[] args) {
//		SkipList<Integer, Integer> list = new SkipList<>();
//		test(list, 10, 10);
		time();
	}
	private static void time() {
		TreeMap<Integer, Integer> map = new TreeMap<>();
		SkipList<Integer, Integer> list = new SkipList<>();
		int count = 100_0000;
		int delta = 10;
		
		Times.test("SkipList", () -> {
			test(list, count, delta);
		});
		
		System.out.println("-----------------------");
		
		Times.test("TreeMap", () -> {
			test(map, count, delta);
		});
	}
	
	public static void test(SkipList<Integer, Integer> list, int count, int delta) {
		for (int i = 0; i < count; i++) {
			list.put(i, i + delta);
		}
//		System.out.println(list);
		for (int i = 0; i < count; i++) {
			Asserts.test(list.get(i) == i + delta);
		}
		Asserts.test(list.size() == count);
		for (int i = 0; i < count; i++) {
			Asserts.test(list.remove(i) == i + delta);
		}
		Asserts.test(list.size() == 0);
	}
	
	private static void test(TreeMap<Integer, Integer> map, int count, int delta) {
		for (int i = 0; i < count; i++) {
			map.put(i, i + delta);
		}
		for (int i = 0; i < count; i++) {
			Asserts.test(map.get(i) == i + delta);
		}
		Asserts.test(map.size() == count);
		for (int i = 0; i < count; i++) {
			Asserts.test(map.remove(i) == i + delta);
		}
		Asserts.test(map.size() == 0);
	}
	
}
一共4层
19:29_4	
4:14_3	19:29_4	
3:13_2	4:14_3	7:17_2	9:19_2	19:29_4	
0:10_1	1:11_1	2:12_1	3:13_2	4:14_3	5:15_1	6:16_1	7:17_2	8:18_1	9:19_2	10:20_1	11:21_1	12:22_1	13:23_1	14:24_1	15:25_1	16:26_1	17:27_1	18:28_1	19:29_4	
【SkipList】
耗时:0.451s(451.0ms)
-------------------------------------
【TreeMap】
耗时:0.383s(383.0ms)
-------------------------------------
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

萌宅鹿同学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值