树上启发式合并:
dsu on tree 粗略讲解:
DSU ON TREE 解决离线统计子树的优秀算法,好像也可以叫静态链分治。
启发式合并一般是将小的集合向大的集合上面去合并,这是一种用于优化暴力统计子树的黑科技。
看一道例题:CF600E,给定你n个序号,每个序号对应的颜色序号为col[i],问你每一棵子树中颜色最多的颜色的编号之和为多少(因为可能有多种颜色出现的次数是最多的,所以问的是颜色序号之和)。
我们先考率暴力的算法,对于每一个节点我们去统计它的子树,但是由于每棵子树之间应该是相互不影响的,所以之前遍历的子树的颜色不应该到后面的子树的遍历,所以我们用一个cnt数组来记录当前子树中颜色最多的节点数为多少时,统计完当前子树的答案之后还要再把这个cnt数组的标记给清楚,这样才能保证答案是正确的。(只能这样完成遍历因为开O(n^2)会MLE)
显然我们这样暴力的话,复杂度是O(n^2)的,但是我们知道前一个子树会对后面的子树产生影响,但是最后一个遍历的子树却不会再影响其他的子树了,所以对于最后一个个遍历的子树我们是不用消除它的标记的。从这个可能的优化想,我们如果找到一棵树的最大的子树(也就是当前的节点的重儿子节点)并且保证他是最后一个遍历的,这样我们不用消除这个重儿子的影响,因此统计答案的时候也不用再算这个重儿子一次了,这样就会降低我们的时间复杂度。最后经证明,https://www.luogu.com.cn/blog/codesonic/dsu-on-tree时间复杂度会降低到O(nlogn),这个复杂度就很优秀了,比一些数据结构和莫队都要快。
树上启发式合并是对于树上统计问题时一种暴力的优化,当兄弟节点的子树会互相影响的时候就可以考虑这个优化算法。
树上启发式合并一般的步骤:
1.首先遍历轻儿子并未他们打上需要消除的标记
2.然后遍历重儿子并打上不需要消除影响的标记
3.然后对当前子树统计答案 (这里注意一下记录一下当前子树的重儿子不对它遍历)
4.将所有轻儿子的答案贡献和重儿子的贡献加起来得到当前节点的答案
5.最后把所有的轻儿子的标记消除
#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
const int MAXN = 1e5+7;
int head[MAXN],tot,siz[MAXN],son[MAXN],cnt[MAXN],c[MAXN];//son数组存放重儿子 cnt编号为i的颜色出现的次数
int maxc,flag;//答案的和 当前出现最多的颜色的次数
ll ans[MAXN],sum;
struct node
{
int to,next;
}edge[MAXN<<1];
void addedge(int u,int v){
edge[++tot].to = v;
edge[tot].next = head[u];
head[u] = tot;
}
void pre_dfs(int u,int fa){
siz[u] = 1;
for(int i = head[u];i != 0;i = edge[i].next){
int v = edge[i].to;
if(v == fa) continue;
pre_dfs(v,u);
siz[u] += siz[v];
if(siz[v] > siz[son[u]])
son[u] = v;
}
}
//具体问题 具体实现的 计算函数
void cal(int u,int fa,int val){
cnt[c[u]] += val;//val = 1代表加一 val = -1代表答案消除
if(cnt[c[u]] > maxc){
maxc = cnt[c[u]];
sum = c[u];//颜色的编号
}
else if(cnt[c[u]] == maxc)
sum += c[u];//多种颜色次数并列最多 把他们加起来
for(int i = head[u];i != 0;i = edge[i].next){
int v = edge[i].to;
if(v == fa || v == flag) continue;//不要写成v == fa || v == son[u]因为u是在变的所以这样会遗漏
cal(v,u,val);//要么就是全加 要么就是 全减
}
}
//*这部分是 dsu on tree的模板
void dfs(int u,int fa,int keep){//keep记录当前的节点的状态是否需要保留
//第一步先算轻儿子的答案贡献
for(int i = head[u];i != 0;i = edge[i].next){
int v = edge[i].to;
if(v == fa || v == son[u]) continue;
dfs(v,u,0);//轻儿子不需要保留它的贡献
}
//第二步就是 走完轻儿子之后 走重儿子
if(son[u]){
dfs(son[u],u,1);
flag = son[u];
}
cal(u,fa,1);//走完重儿子之后 计算一下 所有轻儿子及其重儿子的答案
flag = 0;//记录不需要遍历的那个 重儿子的编号
ans[u] = sum;
if(!keep){
cal(u,fa,-1);//删除标记
maxc = sum = 0;
}
}
*//核心部分
int main()
{
int n;
scanf("%d",&n);
for(int i = 1;i <= n;i ++) scanf("%d",&c[i]);
int a,b;
for(int i = 1;i < n;i ++){
scanf("%d%d",&a,&b);
addedge(a,b);
addedge(b,a);
}
pre_dfs(1,0);
dfs(1,0,0);
for(int i = 1;i <= n;i ++){
printf(i == n?"%lld\n":"%lld ",ans[i]);
}
return 0;
}