开始还是让我们了解了解什么是并查集!
定义:
并查集是一种树型的数据结构,用于处理一些不相交集(Disjoint Sets)的合并及查询问题。常常在使用中以森林来表示。集就是让每个元素构成一个单元素的集合,也就是按一定顺序将属于同一组的元素所在的集合合并。。在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中。这样的问题看起来似乎很简单,每次直接暴力查找即可,但是我们需要注意的问题是,在数据量非常大的情况下,那么时间复杂度将达到O(N*n)(n为查询次数),那么这类问题在实际应用中,如果采取上述方法去做的话,耗费的时间将是巨大的。而如果用常规的数据结构去解决该类问题的话(顺序结构,普通树结构等),那么计算机在空间上也无法承受。所以,并查集这种数据结构便应运而生了。
描述:
话说江湖上散落着各式各样的大侠,有上千个之多。整天背着剑在外面走来走去,碰到不是一路人的,就要打一架。但大侠们有一个优点就是讲义气,绝对不打自己的朋友。而且他们信奉“朋友的朋友就是我的朋友”,只要是能通过朋友关系串联起来的,都认为是自己人。这样,江湖上就形成了一个个群落,通过两两之间的朋友关系串联起来。而不在同一个群落的人,无法通过朋友关系起来,于是就可以放心往死了打。但是两个原本互不相识的人,如何判断是否属于一个朋友圈呢?我们可以在每个朋友圈内推举出一个有名望的人,作为该圈子的代表人物,这样,每个圈子就可以这样命名“齐达内朋友之队”……两人只要互相对一下自己的队长是不是同一个人,就可以确定敌友关系了。
但是还有问题啊,大侠们只知道自己直接的朋友是谁,很多人压根就不认识队长,要判断自己的队长是谁,只能漫无目的的通过朋友的朋友关系问下去:“你是不是队长?你是不是队长?”这样一来,队长面子上挂不住了,而且效率太低,还有可陷入无限循环中。于是队长下令,重新组队。队内所有人实行分等级制度,形成树状结构,我队长就是根节点,下面分别是二级队员、三级队员。每个人只要记住自己的上级是谁就行了。遇到判断敌友的时候,只要一层层向上问,直到最高层,就可以在短时间内确定队长是谁了。由于我们关心的只是两个人之间是否连通,至于他们是如何连通的,以及每个圈子内部的结构是怎样的,甚至队长是谁,并不重要。所以我们可以放任队长随意重新组队,只要不搞错敌友关系就好了。于是,门派产生了。
下面我们来看并查集的实现。int pre[1000] 这个数组,记录了每个大侠的上级是谁。大侠们从1开始编号,pre[15]=3就表示15号大侠的上级是3号大侠。如果一个人的上级就是他自己,那说明他就是掌门人了,查找到此为止。也有孤家寡人自成一派的。。每个人都只认自己的上级。ind这个函数就是找掌门用的,意义再清楚不过了。
简单的说这个函数就是用来找上级的
int find (int x)
{
int r=x;
while (pre[r ]!=r)
r=pre[r ] ;
return r ;
}
还有一种更加简单的写法:
int find(int x){
return x==pre[x]?x:find(pre[x]);
}
那么,还有一个问题,怎么把记录门派记录下来,当两人成为朋友时,他们所在的门派也全都是朋友的朋友了,这个时候,我们只要找到他们的掌门,把其中一个的掌门改成另一个(原来是他本身),这样两个门派就变成一个门派了。
int find (int x){
int r=x;
while ( pre[r ] != r )
r=pre[r ];
int i=x , j ;
while ( i != r ){
j = pre[ i ];
pre [ i ]= r ;
i=j;
}
return r ;
}
在并查集的基础上,对其中的每一个元素赋有某些值。在对并查集进行路径压缩和合并操作时,这些权值具有一定属性,在这种情况下,需要对程序进行一些改动(视情况而定),常将他们与父节点的关系,变化为与所在树的根结点关系。
这是主要的程序段。
下面让我们根据两个模板题来深入了解一下并查集:
1.HDU1232 畅通工程
某省调查城镇交通状况,得到现有城镇道路统计表,表中列出了每条道路直接连通的城镇。省政府“畅通工程”的目标是使全省任何两个城镇间都可以实现交通(但不一定有直接的道路相连,只要互相间接通过道路可达即可)。问最少还需要建设多少条道路?
Input
测试输入包含若干测试用例。每个测试用例的第1行给出两个正整数,分别是城镇数目N ( < 1000 )和道路数目M;随后的M行对应M条道路,每行给出一对正整数,分别是该条道路直接连通的两个城镇的编号。为简单起见,城镇从1到N编号。
注意:两个城市之间可以有多条道路相通,也就是说
3 3
1 2
1 2
2 1
这种输入也是合法的
当N为0时,输入结束,该用例不被处理。Output
对每个测试用例,在1行里输出最少还需要建设的道路数目。
Sample Input
4 2 1 3 4 3 3 3 1 2 1 3 2 3 5 2 1 2 3 5 999 0 0
Sample Output
1 0 2 998 Huge input, scanf is recommended.
Hint
Hint
#include<cstdio>
#include<iostream>
using namespace std;
int n,m,bin[1010];
int find(int x){
int r=x;
while(bin[r]!=r)
r=bin[r];
return r;
}
void mer(int x,int y){
int fx,fy;
fx=find(x);
fy=find(y);
if(fx!=fy)
bin[fx]=fy;
}
int main()
{
int x,y;
while(cin>>n>>m&&n){
int count=-1;
for(int i=1;i<=n;i++)
bin[i]=i;
for(int i=1;i<=m;i++){
cin>>x>>y;
mer(x,y);
}
for(int i=1;i<=n;i++)
if(bin[i]==i)
count++;
cout<<count<<endl;
}
return 0;
}
2.HDU 还是畅通工程
某省调查乡村交通状况,得到的统计表中列出了任意两村庄间的距离。省政府“畅通工程”的目标是使全省任何两个村庄间都可以实现公路交通(但不一定有直接的公路相连,只要能间接通过公路可达即可),并要求铺设的公路总长度为最小。请计算最小的公路总长度。
Input
测试输入包含若干测试用例。每个测试用例的第1行给出村庄数目N ( < 100 );随后的N(N-1)/2行对应村庄间的距离,每行给出一对正整数,分别是两个村庄的编号,以及此两村庄间的距离。为简单起见,村庄从1到N编号。
当N为0时,输入结束,该用例不被处理。Output
对每个测试用例,在1行里输出最小的公路总长度。
Sample Input
3 1 2 1 1 3 2 2 3 4 4 1 2 1 1 3 4 1 4 1 2 3 3 2 4 2 3 4 5 0
Sample Output
3 5 Huge input, scanf is recommended.
Hint
Hint
/*并查集,用来处理一些不相交集合的查询及合并问题。
有三个操作:
初始化:把每个元素所在的集合初始化为自身(即根结点为自身);
查找:查找元素所在的集合,即根结点;
合并:将两个元素所在的集合合并为一个集合(即让两个集合的根结点变成一个)。
大概思路就是:起初让每个村庄自身各为一个集合,设根结点就是自己本身(设根结点的目的就是为了方便查询并合并),同时又用到了最小生成树的克鲁斯卡尔算法,即让每两个村庄的距离从小到大依次排序,然后从小开始遍历两个村庄,先判断这两个村庄的根结点是否相同; 如果不同,说明在不同的集合,则开始合并他们,并把他们的距离加起来; 如果根结点相同,则在同一个集合,这时候就不能连他们了(克鲁斯卡尔算法中不能产生回路)。*/
#include <cstdio>
#include <algorithm>
using namespace std;
int f[103]; //村庄的个数,节点
struct ss
{
int x,y,z;
}a[5000];
bool cmp(ss a,ss b)
{ return a.z<b.z; }
int find(int x)
{
return f[x]==x ? x : find(f[x]); //查询操作:返回的是x的根结点
}
int main()
{
int N,n,i,b,c;
while(scanf("%d",&N),N)
{
int s=0;
n=N*(N-1)/2;
for(i=1;i<=N;i++) //初始化 ,一开始每个村庄都是一个单独的集合,编号从1到n
f[i]=i;
for(i=1;i<=n;i++)
scanf("%d%d%d",&a[i].x,&a[i].y,&a[i].z);
sort(a+1,a+1+n,cmp);
for(i=1;i<=n;i++)
{
int b=find(a[i].x);
int c=find(a[i].y);
if(b==c)continue;
f[c]=b; //合并操作
s+=a[i].z;
}
printf("%d\n",s);
}
return 0;
}