浅谈LCA问题(最近公共祖先)(四种做法)

【模板】最近公共祖先(LCA)

u p d a t e   2023.1.3 update \ 2023.1.3 update 2023.1.3 新增了树链剖分

题目描述

如题,给定一棵有根多叉树,请求出指定两个点直接最近的公共祖先。

输入格式

第一行包含三个正整数 N , M , S N,M,S N,M,S,分别表示树的结点个数、询问的个数和树根结点的序号。

接下来 N − 1 N-1 N1 行每行包含两个正整数 x , y x, y x,y,表示 x x x 结点和 y y y 结点之间有一条直接连接的边(数据保证可以构成树)。

接下来 M M M 行每行包含两个正整数 a , b a, b a,b,表示询问 a a a 结点和 b b b 结点的最近公共祖先。

输出格式

输出包含 M M M 行,每行包含一个正整数,依次为每一个询问的结果。

样例 #1

样例输入 #1

5 5 4
3 1
2 4
5 1
1 4
2 4
3 2
3 5
1 2
4 5

样例输出 #1

4
4
1
4
4

提示

对于 30 % 30\% 30% 的数据, N ≤ 10 N\leq 10 N10 M ≤ 10 M\leq 10 M10

对于 70 % 70\% 70% 的数据, N ≤ 10000 N\leq 10000 N10000 M ≤ 10000 M\leq 10000 M10000

对于 100 % 100\% 100% 的数据, N ≤ 500000 N\leq 500000 N500000 M ≤ 500000 M\leq 500000 M500000

样例说明:

该树结构如下:

第一次询问: 2 , 4 2, 4 2,4 的最近公共祖先,故为 4 4 4

第二次询问: 3 , 2 3, 2 3,2 的最近公共祖先,故为 4 4 4

第三次询问: 3 , 5 3, 5 3,5 的最近公共祖先,故为 1 1 1

第四次询问: 1 , 2 1, 2 1,2 的最近公共祖先,故为 4 4 4

第五次询问: 4 , 5 4, 5 4,5 的最近公共祖先,故为 4 4 4

故输出依次为 4 , 4 , 1 , 4 , 4 4, 4, 1, 4, 4 4,4,1,4,4

2021/10/4 数据更新 @fstqwq:应要求加了两组数据卡掉了暴力跳。

浅浅分析一下?

  • 首先,知道最近公共祖先是什么意思
  • 这个节点的父节点,父节点的父节点都是祖先……,甚至自己都是祖先
  • 去看看这个题的样例解释,明白了这个概念后,再看后面。

暴力做法?

  • 不要把算法想的太复杂,说到底,就是暴力的思路,然后想尽办法优化,什么常数优化啊一大堆乱七八糟的。
  • 这道题也是一样,我们来考虑暴力做法
  • 记录一个点的所有祖先,枚举另一个点的祖先,相同输出。
  • 如果出题人故意卡你,给你出一个两条互不相同的链,然后头结点拼起来,然后给你一个查询:两条链的尾结点,你肯定会超时。

倍增

  • 预处理

  • 我们需要知道每个点的祖先,但不需要全部,毕竟空间存不下(具体思路见我RMQ的思路)
  • f [ i ] [ j ] f[i][j] f[i][j]表示 i i i 2 j 2^j 2j级祖先是谁
  • f [ i ] [ 0 ] f[i][0] f[i][0]表示 i i i的父亲…………
  • 状态转移方程: f [ i ] [ j ] = f [ f [ i ] [ j − 1 ] ] [ j − 1 ] f[i][j]=f[f[i][j-1]][j-1] f[i][j]=f[f[i][j1]][j1]
  • 这个怎么记呢?
  • “爸爸的爸爸叫爷爷”
  • 查询

  • 第一步:对齐
  • x , y x,y xy深度不一样,不妨设 x x x的深度 > y >y >y的深度
  • 首先令 x x x爬到 x x x的某个深度与 y y y相等的祖先
  • 如果 y = = x y==x y==x y y y就是 x x x的祖先,输出 y y y即可,否则进入下一步
  • 第二步:爬树
  • x , y x,y x,y以倍增的形式向上爬树,单次查询: O ( l o g 2 n ) O({log_{2}}^{n}) O(log2n)
  • d f s dfs dfs查询每个节点的 2 j 2^j 2j级祖先(这里用的是链式前向星存储)(不会的去查吧

void dfs(int x,int fat)
{
	fa[x][0]=fat;
	deep[x]=deep[fat]+1;//深度等于他爸的深度+1
	for(int i=1;i<=lg[deep[x]];++i)
		fa[x][i]=fa[fa[x][i-1]][i-1];//爸爸的爸爸叫爷爷
	for(int i=head[x];i;i=edge[i].next)
		if(edge[i].to!=fat)//不是父亲
			dfs(edge[i].to,x);//遍历
	}
  • 开始爬树(同一高度)

int LCA(int x,int y)
{
	if(deep[x]<deep[y])
		swap(x,y);//不妨设x深度大于y
		while(deep[x]>deep[y])
			x=fa[x][lg[deep[x]-deep[y]]-1];//RMQ讲过的,log值要减一
	if(x==y)return x;//y是x的祖先
//现在x和y在同一深度上
  • 继续爬树

for(int k=lg[deep[x]]-1;k>=0;k--)//注意遍历顺序
		if(fa[x][k]!=fa[y][k]){//没爬到
			x=fa[x][k];      
			y=fa[y][k];      			
		}
		//也许超了,不往上爬                      
	return fa[x][0];//爬完之后,它肯定在最近公共祖先的儿子,返回他爸                   
	}
  • C o d e : Code: Code:

#include<bits/stdc++.h>

using namespace std;
struct node{int to,nxt;}edge[1000005];
int n,m,s,head[1000005],cnt;
int fa[1000005][25],r[1000005],lg[1000005];
void log_2(int k){
	for(int i=1;i<=k;i++)
		lg[i]=lg[i-1]+((1<<lg[i-1])==i);
}
void add(int from,int to){
	edge[++cnt].to=to,edge[cnt].nxt=head[from],head[from]=cnt;
}
void dfs(int u,int fat){//dfs初始化fa数组
	fa[u][0]=fat,r[u]=r[fat]+1;
	for(int i=1;i<lg[r[u]];/*注意-1*/i++) 
		fa[u][i]=fa[fa[u][i-1]][i-1];//爸爸的爸爸叫爷爷
	for(int i=head[u];i;i=edge[i].nxt)
		if(edge[i].to!=fat)
			dfs(edge[i].to,u);
}
int LCA(int x,int y){
	if(r[x]<r[y])swap(x,y);//不妨设x比y深 
	while(r[x]>r[y])
		x=fa[x][lg[r[x]-r[y]]-1];//注意减一 
	if(x==y) return y;//y是x的祖先
	for(int i=lg[r[x]]-1;i>=0;i--){//预好跳完整个数的准备,从大到小,注意减一 
		if(fa[x][i]!=fa[y][i]) x=fa[x][i],y=fa[y][i];//跳
		//不然什么都不干 
	}
	return fa[x][0];//返回他的父亲,自行模拟 
}
int main()
{
	cin>>n>>m>>s;
	for(int i=1;i<n;i++){
		int u,v;scanf("%d %d",&u,&v);
		add(u,v),add(v,u);
	}
	log_2(n);
	dfs(s,0);
	for(int i=1;i<=m;i++){
		int x,y;scanf("%d %d",&x,&y);
		printf("%d\n",LCA(x,y));
	}
	return 0;
}

RMQ

  • 这东西没想出来正常(因为我没有想出来),非常神奇
  • 我们先来了解各个需要用到的数组含义
  • v e r [ i ] ver[i] ver[i]表示 d f s dfs dfs i i i个访问的节点
  • R [ i ] R[i] R[i]表示 v e r [ i ] ver[i] ver[i]所在的层数,也就是深度
  • f i r s t [ i ] first[i] first[i]表示 i i i个节点在 v e r [ i ] ver[i] ver[i]的最小编号,也就是第一个出现的编号
  • 图
  • 如果我们要求 d d d f f f L C A LCA LCA,我们发现 d d d第一次出现在 4 4 4 f f f第一次出现在 9 9 9,由 d f s dfs dfs的性质可以知道,在 4   9 4~9 4 9之间深度最小的点就是 L C A LCA LCA
  • 这不就是区间查询问题吗?
  • 于是我们就想到了 R M Q RMQ RMQ,预处理 O ( n l o g 2 n ) O(n{log_{2}}^n) O(nlog2n),查询: O ( 1 ) O(1) O(1)非常之快
  • 直接上代码,都讲过(三个数组的预处理都会吧

  • C o d e : Code: Code:

//LCA(RMQ方法) 
#include<bits/stdc++.h>

using namespace std;
struct node{int value,nxt,to;}edge[2000005];
int n,m,s,head[1000005],cnt,tot;
int fir[1000005];//每个点第一次出现的时间 
int ver[1000005];//时间戳
int r[1000005];//时间戳每个点的深度 
int f[20][1000005];//RMQ数组(记录深度)
int rec[20][1000005];//记录标号 
int lg[1000005];//log2数组 
void tiao_shi(){
	for(int i=1;i<=tot;i++) cout<<ver[i]<<' ';
	cout<<endl;
	for(int i=1;i<=tot;i++) cout<<r[i]<<' ';
	cout<<endl;
	for(int i=1;i<=n;i++) cout<<fir[i]<<' ';
	cout<<endl;
}
void add(int from,int to){//链式前向星 
	edge[++cnt].to=to,edge[cnt].nxt=head[from],head[from]=cnt;
}
void log_2(int k){
	for(int i=1;i<=k;i++)
		lg[i]=lg[i-1]+(1<<lg[i-1]==i);
}
void dfs(int u,int dep){
	fir[u]=++tot,ver[tot]=u,r[tot]=dep;
	for(int i=head[u];i;i=edge[i].nxt){
		int v=edge[i].to;
		if(!fir[v])
			dfs(v,dep+1),ver[++tot]=u,r[tot]=dep;//去了又,回来 
	}
}
void RMQ_init(){//RMQ初始化,详见RMP模板 
	log_2(tot);//求log2 1~tot比cmath库的函数快很多
	for(int i=1;i<lg[tot];i++)
		for(int j=1;j+(1<<i)-1<=tot;j++)
			f[i][j]=1e9; 
	for(int i=1;i<=tot;i++)//数组初始化 
		f[0][i]=r[i],rec[0][i]=ver[i];
	for(int i=1;i<lg[tot];i++)
		for(int j=1;j+(1<<i)-1<=tot;j++){
			if(f[i-1][j]<f[i-1][j+(1<<i-1)])
				f[i][j]=f[i-1][j],rec[i][j]=rec[i-1][j];
			else f[i][j]=f[i-1][j+(1<<i-1)],rec[i][j]=rec[i-1][j+(1<<i-1)];//聚合 
		}
}
int main()
{
	cin>>n>>m>>s;
	for(int i=1;i<n;i++){
		int u,v;scanf("%d %d",&u,&v);
		add(u,v),add(v,u);
	}
	dfs(s,1);
	RMQ_init();
	for(int i=1;i<=m;i++){
		int l,r;scanf("%d %d",&l,&r);
		l=fir[l],r=fir[r];
		if(l>r)swap(l,r);
		int k=lg[r-l+1]-1;//注意减一  
		if(f[k][l]<f[k][r-(1<<k)+1]) printf("%d\n",rec[k][l]);
		else printf("%d\n",rec[k][r-(1<<k)+1]);
	}
	//详细见RMQ,这里只提供思路 
//	tiao_shi();
	return 0;	
}

tarjan

  • 自认为讲不清楚
  • 推荐一个详解博客:tarjan——LCA
  • 这里说一下简略思路
  • 第一步遍历, D F S DFS DFS遍历,如果走不下去了,就把那个点用并查集并起来
  • 然后用一个 v i s vis vis数组标记,如果遍历到一个点,寻找和他有关系的点,如果那个点被标记过了,他们的最近公共祖先就是 f i n d ( 那个点 ) find(那个点) find(那个点)
  • 详细请见那个博客,这里给出这个博客给的思路写出来的代码
  • C o d e : Code: Code:

#include<bits/stdc++.h>

using namespace std;
struct node{int to,nxt,id;}edge[1000005],deg[1000005];
int n,m,s,cnt,dcnt,head[1000005],dhd[1000005],ict;
int fa[1000005],rak[1000005];//并查集
int vis[1000005];//标记数组 
int ans[1000005];//答案数组 
void add(int from,int to){
	edge[++cnt].to=to,edge[cnt].nxt=head[from],head[from]=cnt;
}
void dadd(int from,int to){
	deg[++dcnt].to=to,deg[dcnt].nxt=dhd[from],dhd[from]=dcnt,deg[dcnt].id=++ict;
	deg[++dcnt].to=from,deg[dcnt].nxt=dhd[to],dhd[to]=dcnt,deg[dcnt].id=ict;
}
void init(){
	for(int i=1;i<=n;i++) fa[i]=i;
}
int find(int x){
	if(x==fa[x]) return x;
	return fa[x]=find(fa[x]);//小优化 
}
void marge(int u,int v){//不能用按秩合并,有顺序的限定! 
	int f1=find(u),f2=find(v);
	fa[f2]=f1;
}
void tarjan(int u,int fat){
	vis[u]=1;
	for(int i=head[u];i;i=edge[i].nxt)
		if(!vis[edge[i].to]&&edge[i].to!=fat)//并查集挺高查找速度 
			tarjan(edge[i].to,u),marge(u,edge[i].to);
	for(int i=dhd[u];i;i=deg[i].nxt)
		if(vis[deg[i].to]&&!ans[deg[i].id])
			ans[deg[i].id]=find(deg[i].to);
}
int main()
{
	cin>>n>>m>>s;
	for(int i=1;i<n;i++){
		int u,v;cin>>u>>v;
		add(u,v),add(v,u);
	}
	for(int i=1;i<=m;i++){
		 int x,y;cin>>x>>y;
		 dadd(x,y);
	}
	init();
	tarjan(s,0);
	for(int i=1;i<=ict;i++) cout<<ans[i]<<endl;
	return 0;
}

树链剖分

  • 个人认为树剖是倍增的另一种优化形式
  • 倍增是使用 S T ST ST表这一神奇东西优化
  • 而树剖就是将一棵树分成若干条链,进而减少跳树的过程
  • 而怎么将一棵树分成几条链呢?
  • 先看看下面一些元素的定义
  1. 重儿子:指的是以这棵树的儿子为根的子树元素最多的儿子
    不理解?
    看看这张图
    在这里插入图片描述
    节点 1 1 1 2 2 2个儿子,分别是节点 2 2 2和节点 3 3 3,以 2 2 2根的子树的元素数量为 1 1 1(就他自己)(为了方便,以 x x x为分根的子树的元素数量为 s i z e x size_x sizex
    s i z e 3 = 2 size_3=2 size3=2,所以元素 1 1 1的重儿子是 3 3 3

2.有重儿子自然也有轻儿子,轻儿子就是父节点除了重儿子以外的儿子,很好理解吧
3.重边:父节点与重儿子的连线
4.轻边:父节点与轻儿子的连线
5.重链:多条重边组成的链
6.轻链:多条轻边组成的链
来自一篇博客
比如上面的图,黑色粗边组成的链子就是重链,其他是轻链
注意:标有红色点的是每条重链的起点

  • 好啦,以上就是一些基础元素,如果你学到这里全部理解,那么下面的实现肯定难不倒你捏
  • 回到正题,首先我们肯定要建链(不准确学名),我们首先先把整个树建出来并且把每个点的重儿子找出来
int f[MAXN], d[MAXN], son[MAXN], size[MAXN];
//f[i]是i的父亲
//d[i]是i的深度
//son[i]是i的重儿子
//size[i]是以i为根的子树的元素总和
void dfs1(int u, int fa, int depth) {//u:现在的点,fa:字面意思,depth:字面意思
	f[u] = fa, d[u] = depth, size[u] = 1;//附初值
	for (int i = head[u]; i; i = edge[i].nxt) {
		int v = edge[i].to;
		if(f[u] == v) continue;
		dfs1(v, u, depth + 1);
		size[u] += size[v];//要先递归,此时size[v]是求出来的
		if(size[v] > size[son[u]]) son[u] = v;//求重儿子
	}
}
  • 接下来,我们就可以正儿八经的建链啦
int top[MAXN], id[MAXN], rt[MAXN], l_cnt;
//top[i]表示i所在的链的链头,即上文图片中打红色点的节点
//id[i],rt[i],l_cnt求和用的,这里先不讲
void dfs2(int u, int t) {
	top[u] = t, id[u] = ++l_cnt, rt[l_cnt] = u;
	if(!son[u]) return ;//叶子节点return掉
	dfs2(son[u], t);//要想清楚,一条重链的节点都是重儿子,所以这条链的top还是原来的top
	for (int i = head[u]; i; i = edge[i].nxt) {
		int v = edge[i].to;
		if(v != son[u] && v != f[u]) //处理轻儿子
			dfs2(v, v);//轻儿子的链头是自己啦
	} 
}
  • 建完链之后我们就可以求 L C A LCA LCA
  • 具体做法就是让两个点条到一条链上,然后高的那个点(也有可能一样高)就是公共祖先啦
int LCA(int x, int y) {
	while(top[x] != top[y]) {
		if(d[top[x]] < d[top[y]]) swap(x, y);//不妨设d[x]大于d[y]
		x = f[top[x]];//跳到链头的父亲那,也就是比他高一级的链的末尾
	}
	if(d[x] > d[y]) swap(x, y);
	return x;//高的那个点就是公共祖先
}
  • 这道题到这里就结束了,配上高清无码代码

C o d e \mathcal{Code} Code

#include<bits/stdc++.h>

using namespace std;
const int MAXN = 5e5 + 7;

struct node{int nxt, to;}edge[2 * MAXN];
int cnt, head[MAXN];
inline void add(int front, int to) {edge[++cnt].to = to, edge[cnt].nxt = head[front], head[front] = cnt;}

int f[MAXN], d[MAXN], son[MAXN], size[MAXN];
void dfs1(int u, int fa, int depth) {
	f[u] = fa, d[u] = depth, size[u] = 1;
	for (int i = head[u]; i; i = edge[i].nxt) {
		int v = edge[i].to;
		if(f[u] == v) continue;
		dfs1(v, u, depth + 1);
		size[u] += size[v];
		if(size[v] > size[son[u]]) son[u] = v;
	}
}
int top[MAXN], id[MAXN], rt[MAXN], l_cnt;
void dfs2(int u, int t) {
	top[u] = t, id[u] = ++l_cnt, rt[l_cnt] = u;
	if(!son[u]) return ;
	dfs2(son[u], t);
	for (int i = head[u]; i; i = edge[i].nxt) {
		int v = edge[i].to;
		if(v != son[u] && v != f[u]) 
			dfs2(v, v);
	} 
}
int LCA(int x, int y) {
	while(top[x] != top[y]) {
		if(d[top[x]] < d[top[y]]) swap(x, y);
		x = f[top[x]];
	}
	if(d[x] > d[y]) swap(x, y);
	return x;
}
 
int N, M, S, x, y, a, b;

int main() {
	ios::sync_with_stdio(false);
	cin.tie(0); cout.tie(0);
	
	cin >> N >> M >> S;
	for (int i = 1; i < N; i++) {
		cin >> x >> y;
		add(x, y), add(y, x);
	}
	
	dfs1(S, 0, 1);
	dfs2(S, S);
	for (int i = 1; i <= M; i++) {
		cin >> a >> b;
		cout << LCA(a, b) << endl;
	}
	return 0;
}

大家可以用这道题练练手。
熟能生巧, N O I NOI NOI路上也是如此,加油啊!童鞋们

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值