平衡树,是平衡的二叉排序树,精确地说,是有一定限度下的平衡。在信息学竞赛中平衡树是一个相当重点的数据结构,而绝大多数的平衡树都是需要旋转的。比如说AVL树和红黑树是两个要在节点上附带信息的带旋转平衡树,这两种平衡树效果不错,但是写起来有点麻烦(貌似AVL树有六种情况需要旋转,红黑树中的删除操作似乎有更多的旋转情况),而SBT(Size Balanced Tree,子树大小平衡树)虽然写起来挺简单的,但是仍然有所缺陷。除了这种完全宽松平衡的平衡树之外,还有像Treap和Splay两种类型,这两种类型在信息学竞赛中比较常用,Treap依赖于给节点赋上一些满足堆性质的随机值,而Splay则依赖于“伸展”操作。虽然这两种平衡树不一定完全平衡,但是对于大多数情况是够用了。虽然Splay在面对有序数据的时候会退化成链,但是在对于某些序列的动态处理问题上几乎完美。
暂且搁置掉这些数据结构,我们来考虑一下另一种平衡树。首先,我们要定义“平衡”的概念。如果一个二叉搜索树节点
x
,对于某个
然后,我们先定义拍扁重建。什么是拍扁重建呢?就是将一堆节点直接重建为最平衡的二叉树,具体操作就是先将这棵子树全部“拍扁”成一个有序序列,然后递归地不断取中点为根节点,然后将剩下来的左右两端序列继续递归地重建并作为这个根节点的左右儿子。
接着,和普通的二叉搜索树一样,但是在每次操作之后都稍微检查一下,从操作的节点位置一路往上找,如果找到某一个节点满足以这个节点为根的子树不满足宽松
α
-高度平衡,那么就直接拍扁重建第一个遇到的就好了(也就是直接重建深度最深的那一个)。
然后,我们来分析替罪羊树的各项修改操作的复杂度。很容易看出,我们分析时只能用均摊的方式去分析,那么这里先采用势能分析。容易发现,一个大小为
size
的子树,只有被再插入
Ω(size)
个节点的时候才会被整体地重构(即不算其孩子的单独重构)。而且,重构的代价也显然是
O(size)
的,那么当我们每插入一个节点时,就给它的所有祖先都先添上
1
的势能,那么每棵子树在重构的时候,其的根节点上就会有足够的势能去重建了,因此所有操作的均摊时间复杂度就是
这里顺便留一个小想法:Splay树的思想是否有可能和替罪羊树结合起来,使得利用一定的“部分重建”,改善Splay树的时间复杂度?替罪羊树的高度始终是不算高的,而Splay的功能却很强大,那能不能有什么方法,修改一下其的势能函数,来分析一下结合后的均摊代价呢?这样是否能够进一步地改进出一个强大的序列查找工具呢?