树链剖分基础
- 树链剖分没有那么难,难度大概和树套树差不多.
- 树链剖分和动态树是比较类似的,能够解决的问题的交集有很多.
树链剖分的基本概念
Q: 树链剖分是用来解决什么问题的呢?
A: 树链剖分其实是一种思想. 通过给树中的每个点重新编号,将树转化成一个序列,使得树中的任意一条路径转化成 O ( log n ) O(\log n) O(logn) 段连续的区间. 这样树上路径的问题,就可以转化成区间问题(一般用线段树去维护).
将树的结点分为重儿子和轻儿子两类,注意叶子结点是没有轻重儿子的.
重儿子:对于当前结点的子结点,以子结点为根的子树中,选取子树大小最大(即结点个数最多)的子结点,作为当前结点的重儿子(如果存在多个最大子树,则任选一个子结点作为重儿子即可).
轻儿子:对于当前结点的子结点,除重儿子外的其余所有子结点都被称为轻儿子.
对应重儿子和轻儿子,有重边和轻边两个概念.
重边:重儿子和它父结点之间的边称为重边.
轻边:除重边外的所有边被称为轻边.
重边有对应的重链的概念.
重链:由尽可能多的重边构成的路径,被称为重链. 每个点都要被包含在某个重链中,如果某个点是轻儿子,则它被包含在它的重儿子构成的重边的重链中. 叶子结点比较特殊,若它不是其父结点的重儿子,则它单独在一个没有重边构成的重链中.
按照树的 DFS 序(即在 DFS 的过程中,遍历到每个点的先后次序),将整棵树变成一个序列.
在 DFS 的遍历过程,要求优先遍历当前结点的重儿子. 这样遍历完之后,可以保证一条重链上所有点的编号都是连续的.
通过两次 DFS,就可以把如上的信息全部处理出来.
- 第一次 DFS 处理出来每个结点的重儿子.
- 第二次 DFS 处理出来 DFS 序,将树转化成一个序列.
定理:树中任意一条路径,均可拆分成 O ( log n ) O(\log n) O(logn) 个连续区间.
证明
- 由于重链在转化后的序列中都是连续的,所以该定理等价于树中任意一条路径,经过的重链数量不超过 O ( log n ) O(\log n) O(logn) 条.
- 考虑最坏情况,即经过都是轻边,都是轻儿子自己单独构成的重链.
- 对于当前结点,由于有轻儿子,其必然有重儿子,若轻儿子的子树大小为 x x x,则当前结点的子树大小必然 ⩾ 2 x \geqslant 2x ⩾2x.
- 因此每经过一条轻边,子树大小就会 × 2 \times 2 ×2,在总共只有 n n n 个结点的情况下,最多能走 O ( log n ) O(\log n) O(logn) 条轻边.
证明示例图证毕
将路径转化成若干条重链
操作方法类似于求最近公共祖先.
对于树中两个点 u , v u,v u,v,想要得到序列中对应的,两点之间的路径.
- 先对比 u , v u,v u,v 两点所在重链的对应顶点 f u , f v f_u,f_v fu,fv.
- 检查哪个顶点的层数更大(即更靠下的顶点,在这里假设 f v f_v fv 层数更大,即假设 d e p [ f v ] > d e p [ f u ] dep[f_v]>dep[f_u] dep[fv]>dep[fu]),则就可以拆出来一段 [ f v , v ] [f_v,v] [fv,v] 的连续区间,并将 v v v 点变为 f v f_v fv 的父结点.
- 最终, u , v u,v u,v