首先是最近公共祖先的概念(什么是最近公共祖先?):
在一棵没有环的树上,每个节点肯定有其父亲节点和祖先节点,而最近公共祖先,就是两个节点在这棵树上深度最大的公共的祖先节点。
换句话说,就是两个点在这棵树上距离最近的公共祖先节点。
所以LCA主要是用来处理当两个点仅有唯一一条确定的最短路径时的路径。
有人可能会问:那他本身或者其父亲节点是否可以作为祖先节点呢?
答案是肯定的,很简单,按照人的亲戚观念来说,你的父亲也是你的祖先,而LCA还可以将自己视为祖先节点。
举个例子吧,如下图所示4和5的最近公共祖先是2,5和3的最近公共祖先是1,2和1的最近公共祖先是1。
这就是最近公共祖先的基本概念了,那么我们该如何去求这个最近公共祖先呢?
通常初学者都会想到最简单粗暴的一个办法:对于每个询问,遍历所有的点,时间复杂度为O(n*q),很明显,n和q一般不会很小。
常用的求LCA的算法有:Tarjan/DFS+ST/倍增
后两个算法都是在线算法,也很相似,时间复杂度在O(logn)~O(nlogn)之间,我个人认为较难理解。
有的题目是可以用线段树来做的,但是其代码量很大,时间复杂度也偏高,在O(n)~O(nlogn)之间,优点在于也是简单粗暴。
这篇博客主要是要介绍一下Tarjan算法(其实是我不会在线…)。
什么是Tarjan(离线)算法呢?顾名思义,就是在一次遍历中把所有询问一次性解决,所以其时间复杂度是O(n+q)。
Tarjan算法的优点在于相对稳定,时间复杂度也比较居中,也很容易理解。
下面详细介绍一下Tarjan算法的基本思路:
1.任选一个点为根节点,从根节点开始。
2.遍历该点u所有子节点v,并标记这些子节点v已被访问过。
3.若是v还有子节点,返回2,否则下一步。
4.合并v到u上。
5.寻找与当前点u有询问关系的点v。
6.若是v已经被访问过了,则可以确认u和v的最近公共祖先为v被合并到的父亲节点a。
遍历的话需要用到dfs来遍历(我相信来看的人都懂吧…),至于合并,最优化的方式就是利用并查集来合并两个节点。
下面上伪代码:
Tarjan(u)//marge和find为并查集合并函数和查找函数
{
for each(u,v) //访问所有u子节点v
{
Tarjan(v); //继续往下遍历
marge(u,v); //合并v到u上
标记v被访问过;
}
for each(u,e) //访问所有和u有询问关系的e
{
如果e被访问过;
u,e的最近公共祖先为find(e);
}
}
个人感觉这样还是有很多人不太理解,所以我打算模拟一遍给大家看。
建议拿着纸和笔跟着我的描述一起模拟!!
假设我们有一组数据 9个节点 8条边 联通情况如下:
1–2,1–3,2–4,2–5,3–6,5–7,5–8,7–9 即下图所示的树
设我们要查找最近公共祖先的点为9–8,4–6,7–5,5–3;
设f[]数组为并查集的父亲节点数组,初始化f[i]=i,vis[]数组为是否访问过的数组,初始为0;
下面开始模拟过程:
取1为根节点,往下搜索发现有两个儿子2和3;
先搜2,发现2有两个儿子4和5,先搜索4,发现4没有子节点,则寻找与其有关系的点;
发现6与4有关系,但是vis[6]=0,即6还没被搜过,所以不操作;
发现没有和4有询问关系的点了,返回此前一次搜索,更新vis[4]=1;
表示4已经被搜完,更新f[4]=2,继续搜5,发现5有两个儿子7和8;
先搜7,发现7有一个子节点9,搜索9,发现没有子节点,寻找与其有关系的点;
发现8和9有关系,但是vis[8]=0,即8没被搜到过,所以不操作;
发现没有和9有询问关系的点了,返回此前一次搜索,更新vis[9]=1;
表示9已经被搜完,更新f[9]=7,发现7没有没被搜过的子节点了,寻找与其有关系的点;
发现5和7有关系,但是vis[5]=0,所以不操作;
发现没有和7有关系的点了,返回此前一次搜索,更新vis[7]=1;
表示7已经被搜完,更新f[7]=5,继续搜8,发现8没有子节点,则寻找与其有关系的点;
发现9与8有关系,此时vis[9]=1,则他们的最近公共祖先为find(9)=5;
(find(9)的顺序为f[9]=7–>f[7]=5–>f[5]=5 return 5;)
发现没有与8有关系的点了,返回此前一次搜索,更新vis[8]=1;
表示8已经被搜完,更新f[8]=5,发现5没有没搜过的子节点了,寻找与其有关系的点;
发现7和5有关系,此时vis[7]=1,所以他们的最近公共祖先为find(7)=5;
(find(7)的顺序为f[7]=5–>f[5]=5 return 5;)
又发现5和3有关系,但是vis[3]=0,所以不操作,此时5的子节点全部搜完了;
返回此前一次搜索,更新vis[5]=1,表示5已经被搜完,更新f[5]=2;
发现2没有未被搜完的子节点,寻找与其有关系的点;
又发现没有和2有关系的点,则此前一次搜索,更新vis[2]=1;
表示2已经被搜完,更新f[2]=1,继续搜3,发现3有一个子节点6;
搜索6,发现6没有子节点,则寻找与6有关系的点,发现4和6有关系;
此时vis[4]=1,所以它们的最近公共祖先为find(4)=1;
(find(4)的顺序为f[4]=2–>f[2]=2–>f[1]=1 return 1;)
发现没有与6有关系的点了,返回此前一次搜索,更新vis[6]=1,表示6已经被搜完了;
更新f[6]=3,发现3没有没被搜过的子节点了,则寻找与3有关系的点;
发现5和3有关系,此时vis[5]=1,则它们的最近公共祖先为find(5)=1;
(find(5)的顺序为f[5]=2–>f[2]=1–>f[1]=1 return 1;)
发现没有和3有关系的点了,返回此前一次搜索,更新vis[3]=1;
更新f[3]=1,发现1没有被搜过的子节点也没有有关系的点,此时可以退出整个dfs了。
以上转载自:https://www.cnblogs.com/JVxie/p/4854719.html
c++代码实现
哇的一声就哭了。。。本来想自己写的。。。结果凉凉了。。。现在的我很绝望,不想说话。。。找了两天的bug了。。。手动再见
以下改编自:https://blog.csdn.net/u012469987/article/details/51305685
#include<bits/stdc++.h>
using namespace std;
#define clr( a , x ) memset ( a , x , sizeof (a) );
#define debug(x) cout << "Line " << __LINE__ << ": " << #x << " = " << x << endl;
const int maxn = 10005; //最大边数
const int maxm = 10005; //最大边数
const int maxq = 1; //最大查询边数
int ecnt; //边的计数,从0开始记录
int ehead[maxn]; //记录图中以i为起点的第一条边的位置
struct Edge{ //链式前向星存储
int v; //这条边指向的终点
int ne; //下一条边的存储下标(默认-1)
} edge[maxm];
void addedge(int u, int v) {
edge[ecnt].v = v, edge[ecnt].ne = ehead[u]; ehead[u] = ecnt++;
}
//---离线处理用到的查询
int ans[maxq]; //记录每次询问的最近公共祖先
int qcnt; //查询中的边的计数,从0开始记录
int qhead[maxn]; //记录查询中以i为起点的第一条边的位置
struct Query{ //询问
int v,ne;
int index; //查询的编号
}query[maxq*2];
void addquery(int u, int v,int index) { //双向,因为查u,v和查v,u是一样的
query[qcnt].index = index;
query[qcnt].v = v, query[qcnt].ne = qhead[u]; qhead[u] = qcnt++;
query[qcnt].index = index;
query[qcnt].v = u, query[qcnt].ne = qhead[v]; qhead[v] = qcnt++;
}
//---并查集
int fa[maxn];
int Find(int x){
int r = x;
while(r != fa[r]){
r = fa[r];
}
return r;
}
void join(int x, int y){
x = Find(x);
y = Find(y);
if(x != y)
fa[y] = x;
}
int du[maxn]; //记录该点的入度,方便判断谁是根节点
int vis[maxn]; //标记该点是否被访问过
void init(){
clr(ehead, -1);
clr(qhead, -1);
clr(vis, 0);
ecnt = 0;
qcnt = 0;
clr(du, 0);
}
void lca(int u){
vis[u] = 1;
//遍历u点的邻接边
for (int i = ehead[u]; ~i; i = edge[i].ne){
int v = edge[i].v;
if(vis[v]){
continue;
}
lca(v);
join(u,v); //注意此处应该把 u 设置为 v 的父节点,不能反,因为u在树上就是v的父/祖先节点
}
//找跟当前u点有关的查询,这个uv查询的答案是v点所在集合的祖先
for (int i = qhead[u]; ~i; i = query[i].ne){
int v = query[i].v;
if(vis[v]){
ans[query[i].index] = Find(v);
//debug(u)debug(v)debug(Find(v))
}
}
}
int main() {
int t; //假如有t组样例
int n, u, v; //假如每组样例有n行边的关系
while(scanf("%d", &t) != EOF){
while(t--){
init();
scanf("%d", &n);
for (int i = 1; i <= n; ++i){
scanf("%d%d", &u, &v);
addedge(u, v);
du[v]++;
fa[i] = i; //每个结点的父亲/祖先 都初始化为自己
}
fa[n] = n;
int querycnt; //假设有querycnt次查询次数
scanf("%d", &querycnt);
for (int i = 1; i <= querycnt; ++i){
scanf("%d%d", &u, &v);
addquery(u, v, i);
}
//找入度为0的点当树根
int root = 1;
for (int i = 1; i <= n; ++i){
if(!du[i]){
root = i;
break;
}
}
lca(root);
for (int i = 1; i <= querycnt; ++i){
printf("%d\n", ans[i]);
}
}
}
return 0;
}