并查集:一种树型的数据结构,用于处理一些不相交集合的合并及查询问题。
对于数组中的元素,我们如何表示元素a与元素b属于一个集合呢?比较容易想到的方法就是如果两个元素属于同一个集合,我们就将对应下标的数组中的值设为一个相同的标记来表示。为了区分不同的集合,每个集合的标记都应该是唯一的,一个比较好的方法就是取该标记为集合元素的最小值。我们看一下查找的过程,假设该数组为father[MAX],为了查找元素a与元素b是否属于同一个集合,只需要看father[a]是否等于father[b],常量时间的复杂度。那么合并两个集合呢?为了合并,首先还是要查找,比较father[a]与father[b],假如father[a]<father[b],就要把father[b]集合中所有元素的值都设为father[a],时间复杂度为O(n)。如果合并操作为m次,时间复杂度就为O(nm),效率并不算高。
怎么改进呢?
上面的分析中,我们看到导致低效的一个重要原因在于合并操作,它需要修改另一个集合所有元素的标记。能不能做到只修改一次呢?这时容易想到合并两颗树的操作,如果采用树形结构上面的效率会不会提高呢?这时我们采用一棵树来表示一个集合,如果两个元素具有相同的树根,就认为它们属于同一个集合。如此以来,查找过程的平均复杂度就变为O(lgn),比上面的方法反而下降了;但是合并操作的复杂度也降低到了O(lgn)。
分析
第二种方案对于合并操作较多的情况相比第一种方案可以明显降低时间复杂度。对于第二种方案也有比较糟糕的情况,就是当我们每次合并的时候,都把高度较大的树加到高度较小的树上,导致树的高度不断增大,这时查找操作的复杂度大大提高,接近于线性时间复杂度,那么其效率就会低于第一种方案。因此,可以考虑按秩合并。维护一个rank数组,表示树的高度,在合并时,把高度小的树合并到高度大的树上。另外一点,对于并查集,我们需要的最重要的信息还是元素是否属于同一个集合,至于树的结构并不重要,可以采用路径压缩进行优化,效率能得到明显的提高。
参考代码:
#define MAX 100005
int father[MAX];
void init(){
int i = 0;
for(i = 0;i < MAX;i++) father[i] = i;
}
int find(int x){
return father[x] == x?x:(father[x] = find(father[x]));
}
void union(int a,int b){
int ra = find(a);
int rb = find(b);
if(ra == rb) return;
if(ra<rb) father[rb] = ra;
else father[ra] = rb;
}
并查集并不难理解,下面主要通过一些题目,加深理解运用
HDU2545 树上战争
Time Limit: 10000/4000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)
Total Submission(s): 545 Accepted Submission(s): 292
Problem Description
给一棵树,如果树上的某个节点被某个人占据,则它的所有儿子都被占据,lxh和pfz初始时分别站在两个节点上,谁当前所在的点被另一个人占据,他就输了比赛,问谁能获胜
Input
输入包含多组数据
每组第一行包含两个数N,M(N,M<=100000),N表示树的节点数,M表示询问数,N=M=0表示输入结束。节点的编号为1到N。
接下来N-1行,每行2个整数A,B(1<=A,B<=N),表示编号为A的节点是编号为B的节点的父亲
接下来M行,每行有2个数,表示lxh和pfz的初始位置的编号X,Y(1<=X,Y<=N,X!=Y),lxh总是先移动
Output
对于每次询问,输出一行,输出获胜者的名字
Sample Input
2 1
1 2
1 2
5 2
1 2
1 3
3 4
3 5
4 2
4 5
0 0
Sample Output
lxh pfz lxh 提示: 本题输入、输出都很多,请使用scanf和printf代替cin、cout。
并查集水题:搜索到根结点的距离,比树要灵活。谁距离根结点越近,谁就获胜。相等的情况下,谁先走,谁获胜。
#include<iostream>
#include<cstdio>
using namespace std;
int father[100005];
int find(int x){
int num = 0;
while(x!=father[x]){
x=father[x];
num++;
}
return num;
}
int main(){
int m,n;
int son,fath;
int lxh,pfz;
while(scanf("%d%d",&n,&m)&&(m!=0&&n!=0)){
int tmpN=n-1;
while(tmpN--){
scanf("%d%d",&fath,&son);
father[son] = fath;
}
int tmpM = m;
int lxhHeight,pfzHeight;
while(tmpM--){
scanf("%d%d",&lxh,&pfz);
lxhHeight = find(lxh);
pfzHeight = find(pfz);
if(lxhHeight<=pfzHeight)
printf("lxh\n");
else
printf("pfz\n");
}
}
return 0;
}
HDU1272 小希的迷宫
Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)
Total Submission(s): 27206 Accepted Submission(s): 8391整个文件以两个-1结尾。
6 8 5 3 5 2 6 4 5 6 0 0 8 1 7 3 6 2 8 9 7 5 7 4 7 8 7 6 0 0 3 8 6 8 6 4 5 3 5 6 5 2 0 0 -1 -1
Yes Yes No
#include<stdio.h>
#include<string.h>
#define MAX 100005
int father[MAX];
void init(){
for(int i=0;i<100000;i++){
father[i]=i;
}
}
int find(int x){
if(x==father[x])
return x;
return father[x] = find(father[x]);
/*
int r=x;
while(father[r]!=r)
r=father[r];
return r;
*/
}
int main(){
int m,n,used[100005],flag;
while(scanf("%d%d",&m,&n)&&(m!=-1&&n!=-1)){
if(m==0 && n==0){
printf("Yes\n");
continue;
}
init();
flag=0;
memset(used,0,sizeof(used));
used[m]=used[n]=1;
father[find(m)]=find(n);
while(scanf("%d%d",&m,&n)&&(m!=0&&n!=0)){
if(find(m)==find(n))
flag=1;
else{
used[m]=used[n]=1;
father[find(n)] = find(m);
}
}
if(flag==1){
printf("No\n");
continue;
}
int cnt=0;
for(int i=1;i<MAX;i++){
if(used[i] && father[i]==i)
cnt++;
}
if(cnt==1)
printf("Yes\n");
else
printf("No\n");
}
return 0;
}
HDU1232 畅通工程
Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)
Total Submission(s): 31466 Accepted Submission(s): 16566注意:两个城市之间可以有多条道路相通,也就是说
3 3
1 2
1 2
2 1
这种输入也是合法的
当N为0时,输入结束,该用例不被处理。
4 2 1 3 4 3 3 3 1 2 1 3 2 3 5 2 1 2 3 5 999 0 0
1 0 2 998Huge input, scanf is recommended.HintHint
#include<stdio.h>
#include<iostream>
using namespace std;
#define MAX 1005
int father[MAX];
void init(){
for(int i=0;i<MAX;i++)
father[i]=i;
}
int find(int x){
if(x==father[x])
return x;
return father[x] = find(father[x]);
}
void merge(int a,int b){
int art = find(a);
int brt = find(b);
if(art!=brt)
father[art] = brt;
}
int main(){
int m,n;
int a,b;
while(scanf("%d",&m)&&m){
init();
scanf("%d",&n);
while(n--){
scanf("%d%d",&a,&b);
merge(a,b);
}
int cnt=0;
for(int i=1;i<=m;i++)
if(father[i]==i)
cnt++;
printf("%d\n",cnt-1);
}
return 0;
}