最近公共祖先——Tarjan算法

最新推荐文章于 2024-05-11 18:26:23 发布

ling_wang

最新推荐文章于 2024-05-11 18:26:23 发布

阅读量923

点赞数 3

分类专栏： C/C++算法知识文章标签：最近公共祖先 Tarjan离线算法

C/C++算法知识专栏收录该内容

55 篇文章 6 订阅

订阅专栏

首先是最近公共祖先的概念(什么是最近公共祖先？)：

　　　　在一棵没有环的树上，每个节点肯定有其父亲节点和祖先节点，而最近公共祖先，就是两个节点在这棵树上深度最大的公共的祖先节点。

　　　　换句话说，就是两个点在这棵树上距离最近的公共祖先节点。

　　　　所以LCA主要是用来处理当两个点仅有唯一一条确定的最短路径时的路径。

　　　　有人可能会问：那他本身或者其父亲节点是否可以作为祖先节点呢？

　　　　答案是肯定的，很简单，按照人的亲戚观念来说，你的父亲也是你的祖先，而LCA还可以将自己视为祖先节点。

　　　　举个例子吧，如下图所示４和５的最近公共祖先是２，５和３的最近公共祖先是１，２和１的最近公共祖先是１。　
这里写图片描述
　　　　这就是最近公共祖先的基本概念了，那么我们该如何去求这个最近公共祖先呢？

　　　　通常初学者都会想到最简单粗暴的一个办法：对于每个询问，遍历所有的点，时间复杂度为O(n*q)，很明显，n和q一般不会很小。

　　　　常用的求LCA的算法有：Tarjan/DFS+ST/倍增

　　　　后两个算法都是在线算法，也很相似，时间复杂度在O(logn)~O(nlogn)之间，我个人认为较难理解。

　　　　有的题目是可以用线段树来做的，但是其代码量很大，时间复杂度也偏高，在O(n)~O(nlogn)之间，优点在于也是简单粗暴。

　　　　这篇博客主要是要介绍一下Tarjan算法(其实是我不会在线…)。

　　　　什么是Tarjan(离线)算法呢？顾名思义，就是在一次遍历中把所有询问一次性解决，所以其时间复杂度是O(n+q)。

　　　　Tarjan算法的优点在于相对稳定，时间复杂度也比较居中，也很容易理解。

　　　　下面详细介绍一下Tarjan算法的基本思路：

　　　　　　1.任选一个点为根节点，从根节点开始。

　　　　　　2.遍历该点u所有子节点v，并标记这些子节点v已被访问过。

　　　　　　3.若是v还有子节点，返回2，否则下一步。

　　　　　　4.合并v到u上。

　　　　　　5.寻找与当前点u有询问关系的点v。

　　　　　　6.若是v已经被访问过了，则可以确认u和v的最近公共祖先为v被合并到的父亲节点a。

　　　　遍历的话需要用到dfs来遍历(我相信来看的人都懂吧…)，至于合并，最优化的方式就是利用并查集来合并两个节点。

　　　　下面上伪代码：

Tarjan(u)//marge和find为并查集合并函数和查找函数
{
    for each(u,v)    //访问所有u子节点v
    {
        Tarjan(v);        //继续往下遍历
        marge(u,v);    //合并v到u上
        标记v被访问过;
    }
    for each(u,e)    //访问所有和u有询问关系的e
    {
        如果e被访问过;
        u,e的最近公共祖先为find(e);
    }
}

　　　　个人感觉这样还是有很多人不太理解，所以我打算模拟一遍给大家看。

　　　　建议拿着纸和笔跟着我的描述一起模拟！！

　　　　假设我们有一组数据 9个节点 8条边联通情况如下：

　　　　1–2，1–3，2–4，2–5，3–6，5–7，5–8，7–9 即下图所示的树

　　　　设我们要查找最近公共祖先的点为9–8，4–6，7–5，5–3；

　　　　设f[]数组为并查集的父亲节点数组，初始化f[i]=i，vis[]数组为是否访问过的数组，初始为0;　
这里写图片描述
　　　　下面开始模拟过程：

　　　　取1为根节点，往下搜索发现有两个儿子2和3；

　　　　先搜2，发现2有两个儿子4和5，先搜索4，发现4没有子节点，则寻找与其有关系的点；

　　　　发现6与4有关系，但是vis[6]=0，即6还没被搜过，所以不操作；

　　　　发现没有和4有询问关系的点了，返回此前一次搜索，更新vis[4]=1；

　　　　这里写图片描述

　　　　表示4已经被搜完，更新f[4]=2，继续搜5，发现5有两个儿子7和8;

　　　　先搜7，发现7有一个子节点9，搜索9，发现没有子节点，寻找与其有关系的点；

　　　　发现8和9有关系，但是vis[8]=0,即8没被搜到过，所以不操作；

　　　　发现没有和9有询问关系的点了，返回此前一次搜索，更新vis[9]=1；

　　　　表示9已经被搜完，更新f[9]=7，发现7没有没被搜过的子节点了，寻找与其有关系的点；

　　　　发现5和7有关系，但是vis[5]=0，所以不操作；

　　　　发现没有和7有关系的点了，返回此前一次搜索，更新vis[7]=1；
这里写图片描述

　　　　表示7已经被搜完，更新f[7]=5，继续搜8，发现8没有子节点，则寻找与其有关系的点；

　　　　发现9与8有关系，此时vis[9]=1，则他们的最近公共祖先为find(9)=5；

　　　　　　(find(9)的顺序为f[9]=7–>f[7]=5–>f[5]=5 return 5;)

　　　　发现没有与8有关系的点了，返回此前一次搜索，更新vis[8]=1；

　　　　表示8已经被搜完，更新f[8]=5，发现5没有没搜过的子节点了，寻找与其有关系的点；

　　　　这里写图片描述

　　　　发现7和5有关系，此时vis[7]=1，所以他们的最近公共祖先为find(7)=5；

　　　　　　(find(7)的顺序为f[7]=5–>f[5]=5 return 5;)

　　　　又发现5和3有关系，但是vis[3]=0，所以不操作，此时5的子节点全部搜完了；

　　　　返回此前一次搜索，更新vis[5]=1，表示5已经被搜完，更新f[5]=2；

　　　　发现2没有未被搜完的子节点，寻找与其有关系的点；

　　　　又发现没有和2有关系的点，则此前一次搜索，更新vis[2]=1；
这里写图片描述
　　　　

　　　　表示2已经被搜完，更新f[2]=1，继续搜3，发现3有一个子节点6；

　　　　搜索6，发现6没有子节点，则寻找与6有关系的点，发现4和6有关系；

　　　　此时vis[4]=1，所以它们的最近公共祖先为find(4)=1;

　　　　　　(find(4)的顺序为f[4]=2–>f[2]=2–>f[1]=1 return 1;)

　　　　发现没有与6有关系的点了，返回此前一次搜索，更新vis[6]=1，表示6已经被搜完了；

　　　　这里写图片描述

　　　　更新f[6]=3，发现3没有没被搜过的子节点了，则寻找与3有关系的点；

　　　　发现5和3有关系，此时vis[5]=1，则它们的最近公共祖先为find(5)=1；

　　　　　　(find(5)的顺序为f[5]=2–>f[2]=1–>f[1]=1 return 1;)

　　　　发现没有和3有关系的点了，返回此前一次搜索，更新vis[3]=1；

　　　　这里写图片描述

　　　　更新f[3]=1，发现1没有被搜过的子节点也没有有关系的点，此时可以退出整个dfs了。

以上转载自：https://www.cnblogs.com/JVxie/p/4854719.html

c++代码实现
哇的一声就哭了。。。本来想自己写的。。。结果凉凉了。。。现在的我很绝望，不想说话。。。找了两天的bug了。。。手动再见
以下改编自：https://blog.csdn.net/u012469987/article/details/51305685

#include<bits/stdc++.h>
using namespace std;

#define clr( a , x ) memset ( a , x , sizeof (a) );
#define debug(x) cout << "Line " << __LINE__ << ": " << #x << " = " << x << endl;
const int maxn = 10005;     //最大边数
const int maxm = 10005;     //最大边数
const int maxq = 1;         //最大查询边数
int ecnt;                   //边的计数，从0开始记录
int ehead[maxn];            //记录图中以i为起点的第一条边的位置

struct Edge{        //链式前向星存储
    int v;          //这条边指向的终点
    int ne;         //下一条边的存储下标（默认-1）
} edge[maxm];

void addedge(int u, int v) {
    edge[ecnt].v = v, edge[ecnt].ne = ehead[u]; ehead[u] = ecnt++;
}

//---离线处理用到的查询
int ans[maxq];     //记录每次询问的最近公共祖先
int qcnt;          //查询中的边的计数，从0开始记录
int qhead[maxn];   //记录查询中以i为起点的第一条边的位置

struct Query{      //询问
    int v,ne;
    int index;     //查询的编号
}query[maxq*2];

void addquery(int u, int v,int index) { //双向，因为查u,v和查v,u是一样的
    query[qcnt].index = index;
    query[qcnt].v = v, query[qcnt].ne = qhead[u]; qhead[u] = qcnt++;
    query[qcnt].index = index;
    query[qcnt].v = u, query[qcnt].ne = qhead[v]; qhead[v] = qcnt++;
}

//---并查集
int fa[maxn];
int Find(int x){
    int r = x;
    while(r != fa[r]){
        r = fa[r];
    }
    return r;
}

void join(int x, int y){
    x = Find(x);
    y = Find(y);
    if(x != y)
        fa[y] = x;
}

int du[maxn];      //记录该点的入度，方便判断谁是根节点
int vis[maxn];   //标记该点是否被访问过
void init(){
    clr(ehead, -1);
    clr(qhead, -1);
    clr(vis, 0);
    ecnt = 0;
    qcnt = 0;
    clr(du, 0);
}

void lca(int u){
    vis[u] = 1;
    //遍历u点的邻接边
    for (int i = ehead[u]; ~i; i = edge[i].ne){
        int v = edge[i].v;
        if(vis[v]){
            continue;
        }
        lca(v);
        join(u,v); //注意此处应该把 u 设置为 v 的父节点，不能反，因为u在树上就是v的父/祖先节点
    }
    //找跟当前u点有关的查询，这个uv查询的答案是v点所在集合的祖先
    for (int i = qhead[u]; ~i; i = query[i].ne){
        int v = query[i].v;
        if(vis[v]){
            ans[query[i].index] = Find(v);
            //debug(u)debug(v)debug(Find(v))
        }
    }
}

int main() {
    int t;           //假如有t组样例
    int n, u, v;     //假如每组样例有n行边的关系
    while(scanf("%d", &t) != EOF){
        while(t--){
            init();
            scanf("%d", &n);
            for (int i = 1; i <= n; ++i){
                scanf("%d%d", &u, &v);
                addedge(u, v);
                du[v]++;
                fa[i] = i;  //每个结点的父亲/祖先 都初始化为自己
            }
            fa[n] = n;

            int querycnt;   //假设有querycnt次查询次数
            scanf("%d", &querycnt);
            for (int i = 1; i <= querycnt; ++i){
                scanf("%d%d", &u, &v);
                addquery(u, v, i);
            }
            //找入度为0的点当树根
            int root = 1;
            for (int i = 1; i <= n; ++i){
                if(!du[i]){
                    root = i;
                    break;
                }
            }
            lca(root);
            for (int i = 1; i <= querycnt; ++i){
                printf("%d\n", ans[i]);
            }
        }
    }
    return 0;
}