并查集 (Disjoint Set)
导引问题
在某个城市里住着n个人,现在给定关于 n个人的m条信息( 1和2认识,5和6认识等 ),
假设所有认识的人一定属于同一个单位,请计算该城市最多有多少单位?
如何实现?
什么是并查集?
英文:Disjoint Set,即“不相交集合”
将编号分别为1…N的N个对象划分为不相交集合,
在每个集合中,选择其中某个元素代表所在集合。
常见两种操作:
合并两个集合
查找某元素属于哪个集合
有什么用途?
实现方法(方法1)
用编号最小的元素标记所在集合;
定义一个数组 set[1..n] ,其中set[i] 表示元素i 所在的集合;
方法(1)——效率分析
有待改进?
对于“合并操作”,必须搜索全部元素!
时间浪费比较多!
实现方法(2)
每个集合用一棵“有根树”表示(双亲表示法p135)
定义数组 set[1..n]
set[i] = i , 则i表示本集合,并是集合对应树的根
set[i] = j, j<>i, 则 j 是 i 的父节点.
方法(2)——效率分析
困惑~~~
性能有本质改进?
合并集合变得很简单
查找最坏的情况等于树的深度(n)
避免最坏情况
方法:将深度小的树合并到深度大的树
实现:假设两棵树的深度分别为h1和h2, 则合并后的树的高度h是:
max(h1,h2), if h1<>h2.
h1+1, if h1=h2.
效果:任意顺序的合并操作以后,包含k个节点的树的最大高度不超过
优化后算法及效率
进一步优化——路径压缩
思想:将它们都指向根结点每次查找的时候,如果路径较长,则修改信息,以便下次查找的时候速度更快
步骤:
第一步,找到根结点
第二步,修改查找路径上的所有节点
带路径压缩的查找算法
find3(x)
{
r = x;
while (set[r] <> r) //循环结束,则找到根节点
r = set[r];
i = x;
while (i <> r) //本循环修改查找路径中所有节点
{
j = set[i];
set[i] = r;
i = j;
}
}
路径压缩示意图
并查集的操作
示例—畅通工程(HDOJ-1232)
题目描述:
某省调查城镇交通状况,得到现有城镇道路统计表,表中列出了每条道路直接连通的城镇。省政府“畅通工程”的目标是使全省任何两个城镇间都可以实现交通(但不一定有直接的道路相连,只要互相间接通过道路可达即可)。问最少还需要建设多少条道路?
畅通工程
Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 22601 Accepted Submission(s): 11801
注意:两个城市之间可以有多条道路相通,也就是说
3 3
1 2
1 2
2 1
这种输入也是合法的
当N为0时,输入结束,该用例不被处理。
4 2 1 3 4 3 3 3 1 2 1 3 2 3 5 2 1 2 3 5 999 0 0
1 0 2 998
ACCode:
#include<stdio.h>
int arr[1010]={0};
int find(int x){ //查找函数
int r=x,i,j;
while(arr[r]!=r)
r=arr[r];
i=x;
while(i!=r){ //优化
j=arr[i];
arr[i]=r;
i=j;
}
return r;
}
void merglist(int x1,int x2){ //合并函数
int x=find(x1);
int y=find(x2);
if(x<=y)
arr[y]=x;
else
arr[x]=y;
}
int main(){
int i,n,m,q1,q2,count;
while(scanf("%d",&n),n){
for(i=1;i<=n;i++){
arr[i]=i;
}
scanf("%d",&m);
while(m--){
scanf("%d%d",&q1,&q2);
merglist(q1,q2);
}
for( i=1,count=0;i<=n;i++)
if(arr[i]==i)
count++;
printf("%d\n",count-1);
}
return 0;
}