跳跃表的推导和数学证明

最新推荐文章于 2024-06-03 13:13:27 发布

spark man

最新推荐文章于 2024-06-03 13:13:27 发布

阅读量481

点赞数 2

分类专栏： java基础文章标签：链表数据结构跳跃表推导 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43810802/article/details/106431905

版权

java基础专栏收录该内容

27 篇文章 0 订阅

订阅专栏

skip list

引子

能够完成动态数据的增删改查最简便的数据结构是什么？

是链表。

链表查询的时间复杂度是O(n)。如何修改最简单的链表，能够让它查得快一点呢？

我们可以多增加一些连接，让它形成网络的结构。

你也可以把它改成一棵树，当然这也可以说是另一种数据结构了。

我们今天要讲跳跃表，skip list。

再增加一张链表，情况会变得很不同。

地铁的例子

某城市的地铁有两条线，一条慢线，它包含所有的车站；一条快线，它的车站是慢线的一个真子集。

数字表示街道号。

慢线位于第二层（最底层），快线在第一层。

比如你要去121街道。

最好的选择是先走快线，走开100街道，然后走慢线，到121街道。

这个就是跳跃表。

跳跃表的第一条规则就是：最底层（在这里我们用L2表示）要包含所有的节点。

那么问题来了：L1（上一层）应该设置几个呢？

L1的理想数值

L1的合理设计是：均匀分布。

既然L1均匀分布，那么查询一个节点的时间就是：
$T=|L_1|+\frac{|L_2|}{|L_1|}$

$L_1|$ 表示 $L_1$ 的长度或者说节点数量。

假设最初的节点数量是 $n$ 。也就是说 $L_2|=n$ ，要使得 $T$ 尽量的小， $L_1|$ 要取什么值呢？

$T=|L_1|+\frac{n}{|L_1|} \geq 2 \sqrt{n}$

当且仅当 $|L_1|=\sqrt{n}$ 时取到最小值。

所以完美的跳跃表应该是这个样子的：

让跳跃表更快

如何让跳跃表查得更快？

设计更多的层。

以上的结果是推测的，当然也可以证明。

现在的关键问题是 $k$ 等于几，使得查询时间最小？

或者说，在已知最底层的数量的情况下（ $n$ ），跳跃表应该设计几层？

所以查询的时间复杂度是 $O(\log_2n)$ 。

重新设计地铁线

按照上面的推理，我们重新设计地铁线。

因为 $n = 8$ ，所以我们设计三层。

那么层与层之间的比率是多少呢?假设第一层的节点数是是 $r$ ，于是 $r^3=8$ ，因此第一层有两个节点。第二层我们设置4个节点。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄6年

128
原创

189
点赞

262
收藏

37
粉丝

关注

私信

热门文章

分类专栏

爬虫 1篇
python 1篇
大数据 18篇
clickhouse
hbase 1篇
项目 2篇
spark 9篇
hadoop 7篇
k8s 1篇
dubbo 3篇
netflix_springcloud 3篇
计算机基础 3篇
netty 4篇
tomcat 1篇
java基础 27篇
linux 4篇
springboot 6篇
mybatis 6篇
spring 19篇
前端 2篇
redis 8篇
MySQL 6篇
数据分析 1篇
机器学习 10篇

最新评论

玩转单例模式
weixin_46316529: 能讲讲反射和类加载的过程吗
玩转单例模式
weixin_46316529: 太几把强了，不过有个疑惑，在双重检索创建单例的方式这块，既然创建对象不是原子性操作，那么即使防止指令重排序也可能出现重复的对象创建，比如在执行到分配内存地址时，其它的线程就可能进入了并开始创建对象了。另外枚举类的单例模式不太懂，我还得看看枚举类
spark对接elasticsearch遇到的坑
书香恋仁心: 解决了，应该就是jar包冲突的原因
mysql乐观锁实例
spark man: 其实就是希望某个时间段数据是稳定的，不能改，比如统计业务，某个时间点的统计；对账；还有数据迁移备份
spark对接elasticsearch遇到的坑
spark man: ClassNotFoundException一般都是版本问题吧

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。