先说一下dsu算法。
例题:子树众数问题。
给出一棵树,每个点有点权,求每个子树中出现次数最多的数的出现次数。
树的节点数为n, n≤500000 n ≤ 500000
这个数据范围, O(nn−−√) O ( n n ) 直接莫队会超时。
考虑一种暴力做法:
开一个全局数组,记录每中数的出现次数。
依次对每个点,用dfs遍历它的子树,并记录每种数的出现次数。
遍历结束后,找到众数,记录结果,并清空这个数组,进行下一次遍历。
可以发现,在最坏情况(例如一条链),算法的时间复杂度是 O(n2) O ( n 2 ) 的。
但是,对于一条链,只要从下至上扫描一遍,就能得出解。
而这样就相当于子树统计后的数组没有清空,而是留给了父节点。
所以,考虑这种优化:
(除根以外)每个结点都有它的父节点,所以,其实无须清空数组,直接留给父节点就行。
但是,如果一个节点的所有子结点都不删除,会很费空间,而且,我们还要将这些子树信息都合并,而合并也是 O(n) O ( n ) 的,每个节点都要合并,所以总复杂度还是 O(n2) O ( n 2 ) 的。
所以,对于每个节点,只能保留一个子结点,其余的还要清空。
为了使效率最高,应该保存子结点数量最多的儿子(即重儿子)。
优化后的时间复杂度:
每个节点,只有在祖先结点到父亲的是轻边时,才会被计算,所以每个最多会算 O(logn) O ( log n ) 次。总时间复杂度就优化到了 O(nlogn) O ( n log n ) 。
要自底向上遍历每个节点。对于每个节点,先遍历轻儿子,再遍历重儿子,最后计算它自己。
如果它到父亲的是轻边,就清空数组,否则不清空。