并查集被很多OIer认为是最简洁而优雅的数据结构之一,主要用于解决一些元素分组的问题。它管理一系列不相交的集合,并支持两种操作:
- 合并(Union):把两个不相交的集合合并为一个集合。
- 查询(Find):查询两个元素是否在同一个集合中。
我们对于并查集的理解将基于洛谷P1551亲戚问题来理解。
https://www.luogu.com.cn/problem/P1551
大家可以先看看这道题,构建一下思路,并想想用怎样的数据结构将他们直接的关系存储起来。
并查集的引入
- 并查集的重要思想在于,用集合中的一个元素代表集合。我曾看过一个有趣的比喻,把集合比喻成帮派,而代表元素则是帮主。接下来我们利用这个比喻,看看并查集是如何运作的。
最开始,所有大侠各自为战。他们各自的帮主自然就是自己。(对于只有一个元素的集合,代表元素自然是唯一的那个元素)
现在1号和3号比武,假设1号赢了(这里具体谁赢暂时不重要),那么3号就认1号作帮主(合并1号和3号所在的集合,1号为代表元素)。
现在2号想和3号比武(合并3号和2号所在的集合),但3号表示,别跟我打,让我帮主来收拾你(合并代表元素)。不妨设这次又是1号赢了,那么2号也认1号做帮主。
现在我们假设4、5、6号也进行了一番帮派合并,江湖局势变成下面这样:
现在假设2号想与6号比,跟刚刚说的一样,喊帮主1号和4号出来打一架(帮主真辛苦啊)。1号胜利后,4号认1号为帮主,当然他的手下也都是跟着投降了。
好了,比喻结束了。如果你有一点图论基础,相信你已经觉察到,这是一个树状的结构,要寻找集合的代表元素,只需要一层一层往上访问父节点(图中箭头所指的圆),直达树的根节点(图中橙色的圆)即可。根节点的父节点是它自己。我们可以直接把它画成一棵树:
怎样实现并查集
初始化
int fa[MAXN];
inline void init(int n)
{
for (int i = 1; i <= n; ++i)
fa[i] = i;
}
假如有编号为1, 2, 3, .., n的n个元素,我们用一个数组fa[]来存储每个元素的父节点(因为每个元素有且只有一个父节点,所以这是可行的)。一开始,我们先将它们的父节点设为自己。
查询
int find(int x)
{
if(fa[x] == x)
return x;
else
return find(fa[x]);
}
我们用递归的写法实现对代表元素的查询:一层一层访问父节点,直至根节点(根节点的标志就是父节点是本身)。要判断两个元素是否属于同一个集合,只需要看它们的根节点是否相同即可。
合并
inline void merge(int i, int j)
{
fa[find(i)] = find(j);
}
合并操作也是很简单的,先找到两个集合的代表元素,然后将前者的父节点设为后者即可。当然也可以将后者的父节点设为前者。
优化方案
从上文中我们就可以实现一个最简单的并查集,但是显而易见这样的并查集的效率是很低的,我们每次查询都要从底层层层递进 ,而实际使用中我们想得到较复杂的亲戚关系时就会浪费很多时间。因此我们可以选择在查询的过程中,把沿途的每个节点的父节点都设为根节点即可。下一次再查询时,我们就可以省很多事。这用递归的写法很容易实现:
int find(int x)
{
if(x == fa[x])
return x;
else{
fa[x] = find(fa[x]); //父节点设为根节点
return fa[x]; //返回父节点
}
}
这样的操作我们一般称之为路径压缩 ,通常简化为:
int find(int x)
{
return x == fa[x] ? x : (fa[x] = find(fa[x]));
}
tips:在洛谷1551这道题中就用到了路径压缩的方法
希望大家自己发掘问题的解决方案。。。
AC代码
-
C版本
#include <cstdio>
#define MAXN 5005
int fa[MAXN], rank[MAXN];
inline void init(int n)
{
for (int i = 1; i <= n; ++i)
{
fa[i] = i;
rank[i] = 1;
}
}
int find(int x)
{
return x == fa[x] ? x : (fa[x] = find(fa[x]));
}
inline void merge(int i, int j)
{
int x = find(i), y = find(j);
if (rank[x] <= rank[y])
fa[x] = y;
else
fa[y] = x;
if (rank[x] == rank[y] && x != y)
rank[y]++;
}
int main()
{
int n, m, p, x, y;
scanf("%d%d%d", &n, &m, &p);
init(n);
for (int i = 0; i < m; ++i)
{
scanf("%d%d", &x, &y);
merge(x, y);
}
for (int i = 0; i < p; ++i)
{
scanf("%d%d", &x, &y);
printf("%s\n", find(x) == find(y) ? "Yes" : "No");
}
return 0;
}
-
java版本
import java.util.*;
public class Main {
public static int[] fa=new int[5005];
public static int[] rank=new int[5005];
public static void main(String[] args) {
Scanner cin=new Scanner(System.in);
int n,m,p;
n=cin.nextInt();
m=cin.nextInt();
p=cin.nextInt();
init(n);
for(int i=1;i<=m;i++){
int x,y;
x=cin.nextInt();
y=cin.nextInt();
merge(x,y);
}
for(int j=1;j<=p;j++){
int x,y;
x=cin.nextInt();
y=cin.nextInt();
if(find(x)==find(y)){
System.out.println("Yes");
}
else{
System.out.println("No");
}
}
cin.close();
}
private static void init(int n){
for(int i=1;i<=n;i++){
fa[i]=i;
rank[i]=1;
}
}
private static int find(int x){
return x == fa[x] ? x : (fa[x] = find(fa[x]));
}
private static void merge(int i, int j)
{
int x = find(i), y = find(j);
if (rank[x] <= rank[y])
fa[x] = y;
else
fa[y] = x;
if (rank[x] == rank[y] && x != y)
rank[y]++;
}
}
由于思路等在前面讲的很清楚了,代码中就没有再写注释,其实就是懒
要是还没看懂,那我也没办法。。。
最后的提示!
很显然可以看出,这道题构建的是一个无向图,而且很显然这个并不是一个联通图(当然也有是连通图的时候,我也不知道有没有那种变态的样例)
那么显而易见,现在除了6之外的所有点都是亲戚,也就是说无6的那个子图是一个无向联通子图,(不知道说的啥请看题给的样例),所以说可以得出结论,在任意联通子图中的两个点必为亲戚关系,为亲戚关系的两个点在同一联通子图中,所以根据这个性质,我们就把问题转化为:在一个无向图中,查询两点是否在同一联通子图中。
希望对大家有所帮助!!!觉得写得不错的麻烦点点
本文来源于作者看的一些资料和别人写的一些相关知识,再加上自己的一点理解,如有侵权请联系作者删改 。选材来源如下: