「数据结构详解·七」并查集的初步


1. 并查集的定义、构成和原理 & 代码实现

并查集(Union-find disjoint sets),是一种处理数据之间的关系的数据结构。
并查集初始是一棵森林
并查集初始化
一开始,每个元素的祖先都指向自己。
我们现在将 1 , 2 1,2 1,2 所在集合合并,就像这样:
并查集1,2
可以发现,我们让 1 1 1祖先指向了 2 2 2祖先
我们现在将 2 , 3 2,3 2,3 所在集合合并:
并查集2,3
我们让 2 2 2祖先指向了 3 3 3祖先
经过一系列操作,就成了如下的样子:
并查集普通
现在问:给出任意两个元素,判断其在上图中是否在同一集合中。
根据人眼观察,我们发现有三个集合 { 1 , 2 , 3 , 4 } , { 5 , 7 , 8 } , { 6 } \{1,2,3,4\},\{5,7,8\},\{6\} {1,2,3,4},{5,7,8},{6},做起来相对容易。
但是在电脑中,这将会使得时间、空间爆炸。
我们可以去访问这两个元素的祖先,判断是否相同。
访问元素的祖先:

int find(int x)
{
	return fa[x]==x?x:find(fa[x]);//如果该节点的根节点为自己,则停止递归,否则继续递归
}

f a i fa_i fai i i i 的祖先,故 f a fa fa 初始是 i i i
可是有的时候无限地递归会导致 TLE/MLE。
我们只关心两个元素是否在同一集合,因此我们可以做一个类似记忆化的操作:

int find(int x)
{
	return fa[x]==x?x:fa[x]=find(fa[x]);//记录最终的祖先
}

这一操作被称为路径压缩
于是就会变成这样:
并查集路径压缩
那么合并我们就可以这么写:

void merge(int x,int y)
{
	fa[find(x)]=find(y);
}

现在我们又要将 3 , 7 3,7 3,7 所在集合合并。
我们有一下两种做法:
并查集7
并查集3
为了让时间复杂度降低,我们当然希望让尽可能少的元素改变祖先。
上面这个例子中,显然将 { 5 , 7 , 8 } \{5,7,8\} {5,7,8} 合并到 { 1 , 2 , 3 , 4 } \{1,2,3,4\} {1,2,3,4} 更优(即图二)。
这一操作被称为按秩合并(启发式合并)
s z i sz_i szi i i i 是祖先时所处集合的集合大小(注意 s z sz sz 初始均为 1 1 1)。
我们可以将合并改成这样:

void merge(int x,int y)
{
	x=find(x);
	y=find(y);
	if(x==y) return;//避免重复处理元素个数
	if(sz[x]>sz[y]) swap(x,y);//按秩合并
	fa[x]=y;
	sz[y]+=sz[x];
}

有了这两个优化,并查集时间复杂度为均摊 Θ ( α ( n ) ) \Theta(\alpha(n)) Θ(α(n)),其中 α ( n ) \alpha(n) α(n) 是反阿克曼函数,增长极其缓慢,甚至可以看作很小的常数。
一般来说,我们只要路径压缩就可以了。
并查集还有带权并查集(即边带有权值)和扩展域并查集等多个变种,这留给读者自行查阅资料与思考。
并查集也有很多应用,我们将在以后逐步讲解。

2. 例题详解

2-1. P3367 【模板】并查集

代码:

#include<bits/stdc++.h>
using namespace std;

int a[10005];

int find(int x)
{
	if(a[x]==x) return x;
	a[x]=find(a[x]);//路径压缩
	return a[x];
}

int main()
{
	int n,m;
	cin>>n>>m;
	while(n--)
	{
		a[n+1]=n+1;
	}//初始化
	while(m--)
	{
		int z,x,y;
		cin>>z>>x>>y;
		if(z==1) a[find(x)]=find(y);//合并
		else cout<<(find(x)==find(y)?'Y':'N')<<endl;//判断两个元素是否为同一个祖先,是则在同一集合内,反之不在
	}
	return 0;
}

2-2. P2078 朋友

这题中出现了负数,我们可以直接使用 map 处理。
我们设小明所处集合元素个数为 x x x,小红所处集合元素个数 y y y,那么答案就是 min ⁡ ( x , y ) \min(x,y) min(x,y)
对于元素个数,我们可以操作之后暴力统计。
代码:

#include<bits/stdc++.h>
using namespace std;

map<int,int>a;

int find(int x)
{
	if(a[x]==x) return x;
	a[x]=find(a[x]);
	return a[x];
}

int main()
{
	int n,m,p,q,s=0,t=0;
	cin>>n>>m>>p>>q;
	for(int i=m*-1;i<=n;i++)
	{
		a[i]=i;//初始化
	}
	for(int i=1;i<=p+q;i++)
	{
		int x,y;
		cin>>x>>y;
		a[find(x)]=find(y);//合并
	}
	for(int i=m*-1;i<=-1;i++)//小红所处集合元素个数
	{
		if(find(a[i])==find(-1)) s++;
	}
	for(int i=1;i<=n;i++)//小明所处集合元素个数
	{
		if(find(a[i])==find(1)) t++;
	}
	cout<<min(s,t);
 	return 0;
}

2-3. P1536 村村通

要想知道答案,就要知道集合个数;要想知道集合个数,我们只需要知道多少个根节点就可以了。
代码:

#include<bits/stdc++.h>
using namespace std;

int a[1005];

int find(int x)
{
	if(a[x]==x) return x;
	a[x]=find(a[x]);
	return a[x];
}

int main()
{
 	while(1)
 	{
	 	int n,m,ans=0;
		cin>>n;
		if(!n) return 0;
		cin>>m;
		for(int i=1;i<=n;i++)
		{
			a[i]=i;
		}
		while(m--)
		{
			int x,y;
			cin>>x>>y;
			a[find(x)]=find(y);
		}
		while(n--)
		{
			if(a[n+1]==n+1) ans++;
		}
		cout<<ans-1<<endl;//一个集合对应一个根节点,故 ans 要减一
	}
}

3. 巩固练习

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值