算法与数据结构八日谈之六——数据结构专题(uncompleted)

最新推荐文章于 2024-07-18 11:02:50 发布

一只蒟蒻

最新推荐文章于 2024-07-18 11:02:50 发布

阅读量1k

点赞数

分类专栏：平衡树主席树数据结构文章标签：数据结构平衡树

本文链接：https://blog.csdn.net/Starry__Night/article/details/46766845

版权

数据结构同时被 3 个专栏收录

5 篇文章 0 订阅

订阅专栏

主席树

3 篇文章 0 订阅

订阅专栏

平衡树

1 篇文章 0 订阅

订阅专栏

这是个大工程
我要慢慢写
朱军稍候
UPD：暂时更完了，代码部分再等会吧，估计很长。

1.最·基础数据结构

数组

别问我为什么把这放进来，我就是闲着没事做

栈

可以在栈空间不够用时用手写栈来进行dfs。

队列

bfs所需的基础数据结构，在spfa时也会用到

链表

在插入操作较多时可以使用链表来维护
hash时可将重复元素以链表的形式挂在一张表上

2.基础数据结构

上面那些东西(除了链表)是毫无实现难度的，学过计算机语言的就会使用，下面这些则需要一点点的算法知识

树状数组

代码简洁，常数小。
可以维护单点修改和区间求和/极值
利用两个树状数组可以区间修改和单点求值
利用三个树状数组可以区间修改和区间求值(然而并没有什么卵用)
一般可以在两行解决问题

线段树

思路简单，编程复杂度小
可以维护区间和/极值。支持区间修改和单点修改

权值线段树

线段树的区间端点由原序列的下标变为值域
在数值与 $n$ 同阶或可以离线操作的情况下各种操作的速度比大多数平衡树要快(跟vEB树差不多)
于是排名就是前缀和，其它的基本操作随便搞搞就可以了

zkw线段树

zkw神的线段树，由顶向下实现，(据说)速度奇快无比。具体的参见其论文《统计的力量》

(普通的)堆

堆可以动态维护集合里的极值。
支持将极值从集合中弹出，向集合中加入一个数，询问极值。
(普通的堆)插入和删除都是 $O(\lg n)$ 的
可以在 $O(n)$ 的时间内建一个大小为n的堆
堆排序即利用堆按大小顺序依次取出每个元素，时间复杂度是 $O(n\lg n)的$

3.进阶数据结构

平衡树

平衡树维护可以判断元素大小关系的集合。

伸展树Splay

伸展树的核心操作是伸展(废话)
每次访问节点，则需要将其旋转到根的位置，这个操作被称为伸展
splay能称作平衡的核心是在伸展中的某种trick
当祖孙三代方向一致时，先转父亲，再转儿子，否则转儿子转两次。
由势能分析可以得到伸展树的均摊复杂度是 $\Theta(\lg n)$ 的(别问我，我不知道咋分析)
伸展树最重要的操作是提取区间，这是它能在oi界中生存的最大的依仗(之一)，每次将待提取的区间的左端点左边那个点伸展到根节点，再将区间右端点右边那个点伸展到根节点右儿子处，此时根节点右儿子的左儿子就是所求区间。
splay可以解决很多需要线段树解决的问题。
非常实用的数据结构，不学不算搞过oi

树堆Treap

可以证明(你™就是不会证瞎扯个啥)，随机插入的二叉排序树的深度是 $O(\lg n)$ 的。于是我们可以强制使插入的数据呈随机的顺序插入。
Treap=Tree+heap,我们给每个节点增加一个域，并将该域的值赋为一个随机数，姑且叫做 $w[n]$ 。对于原数据，treap为一棵二叉检索树；对于 $w[i]$ treap是一个大根/小根堆。
treap的实现很简单，与普通的二叉检索树没有很大的区别。
如果在插入后子树的 $w$ 域不满足堆的性质，则将其旋转至原节点上方。
同理，删除时也要考虑维护堆的性质。
treap的编程复杂度较低，非常适合在考场上写，而且效率是相当不错的。

节点大小平衡树SBT

喜闻乐见的傻逼树。
不需要额外的域来保存信息。
论文上说的很神，但可以用人字形的数据卡掉。。。
实际效率比上面那俩要高，但它的maintain操作太淡腾并不好写。
(好吧我不会写这玩意，我在瞎哔哔)

朝鲜树

湖北的上古神犇albus随手yy出的数据结构，为vfk领悟下面这玩意做了铺垫(叫这个名字只因为金正中的名字与朝鲜前领导人二儿子重合)

替罪羊树Scapegoat Tree

神一样的数据结构(之一)，在实践中是最快的平衡树。
通过设置参数来平衡插入与查询的常数复杂度。
当插入时存在一个节点的左右儿子大小的最大值大于 $\alpha$ 乘该节点大小，则重建以该节点为根的子树。
通过复杂度分析可以知道(我不知道)，替罪羊树的“各种”操作的复杂度是均摊 $\Theta(\lg n)$ 的。
而且其不需要旋转的特性为其套上其它数据结构提供了可能。

块状链表

万能数据结构
splay能干的它都能干。
splay不能干的它也能干。
它啥都能干。
基于分块思想的数据结构，在处理询问时相当暴力，这也为其提供了很大的灵活性。
所有操作几乎都是暴力。套上平衡树后还能顺便解决区间k大值问题。
说起来简单，但实现却真是哔了狗了，参见orzjry这道题。

4.高端数据结构(雾)

可持久化数据结构

可持久化(函数式)线段树，也称主席树

在完成普通线段树能完成的任务时，还能支持询问历史版本。
将权值线段树的思想应用到主席树上，可以用主席树解决静态的区间k大值问题。
函数式的思想是，只定义，不修改，我们每次插入一个值时，都从根开始建一(/半)棵新的主席树，因为有一半是相同的，所以可以利用原来的线段树的信息从而减少空间消耗。

可持久化字典树

利用可持久化字典树可以解决区间最大异或和问题。
仍然是利用函数式的原理，每次插入时都新建节点。每次询问从高位向低位贪心，实现与主席树类似。

可持久化平衡树

平衡树的旋转操作很可怕，修改了一大堆的东西，不适合可持久化。
我们对treap进行一些修改，引入split和merge两个操作，分别是把一个treap以某个数为界分为俩treap，还有把两个值域不相交的treap合并。
这样的话插入或删除都只需要先split再merge即可，而这两个操作不需要旋转，这对可持久化提供了可能。
具体的实现我不会，所以上面这坨也是我瞎哔哔的，所以还是去搜论文吧。

数据结构的嵌套

线段树套线段树，也称二维线段树

最“常见”的数据结构嵌套的情形之一，白书上就提供了具体的实现。
实现虽然复杂，但是原理却相当简单，如果明白了给出足够的时间是可以写出来的。
但二维线段树不支持区间修改。
但二维线段树不支持区间修改。
因为比较重要所以要说两遍。
所以很多时候需要差分或者其它的把区间修改为单点修改。

线段树套线段树套线段树，也称三维线段树

sto VFleaKing orz

树状数组套主席树

在解决有修改操作的区间k大值时，原版的主席树就不能直接上了，因为需要修改 $O(n)$ 棵主席树，这是无法接受的复杂度。
考虑主席树维护的是前缀和，而树状数组维护的前缀和只需要访问 $O(\lg)$ 个节点，所以可以考虑树状数组套主席树。
每次修改时，修改树状数组对应的 $O(\lg n)$ 棵主席树即可，所以修改的复杂度是 $O(\lg^2n)$ ,询问类似，复杂度与修改相当。
这是相当优秀的一种待修改区间k大值问题的解法，树状数组极低的编程复杂度决定了它的实用性。

线段树套平衡树

线段树这傻大个，不会旋转，所以可以随便套。
对于每棵线段树，我们对于其中的值建一棵平衡树。
空间 $O(n^2)$ 会炸?
有这种想法的同学再想想线段树到底是啥。
线段树套平衡树可以求区间k大值，区间排名，区间前驱，区间后继，以及修改(二逼平衡树)。
对于区间排名，只需将原区间以线段树的方式分为 $O(\lg n)$ 个区间，然后对于每个区间的平衡树上求出小于其的数的个数之和，再加1就是排名,复杂度是 $O(\lg^2 n)$ 的。
然后是区间k大，二分答案，直到排名等于k，复杂度是 $O(\lg^3 n)$ ，在时限接受的数据范围内与 $O(\sqrt{n}\lg n)$ 的块链套平衡树差不多，但后者常数太大，效率没法比。
前驱后继与平衡树的操作类似，不再赘述。

替罪羊树套平衡树

继续sto VFleaKing orz
vfk的神题:带插入区间k大值。
有了插入操作，除了块链，前面的树套树变得毫无意义。
插入就需要平衡，平衡需要旋转，一旋转就炸飞了。
我们需要考虑不需要旋转或者旋转次数很少的平衡树。
对，替罪羊树！
对于原区间的我们不再使用线段树，而是改成用替罪羊树维护。
在插入时如果大小不满足替罪羊树的要求，就对于该子区间和那些子区间所对应的平衡树重建。
可以证明，复杂度是均摊 $\Theta(\lg\lg n)$ 的。
因为重建的原因，在处理时要使用垃圾回收，不然空间复杂度不能接受。