在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中。这一类问题其特点是看似并不复杂,但数据量极大,若用正常的数据结构来描述的话,往往在空间上过大,计算机无法承受;即使在空间上勉强通过,运行的时间复杂度也极高,根本就不可能在规定的运行时间(1~3秒)内计算出试题需要的结果,只能用并查集来描述。
定义
并查集(Disjoint Set),即“不相交集合”,是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。常常在使用中以森林来表示。集就是让每个元素构成一个单元素的集合,也就是按一定顺序将属于同一组的元素所在的集合合并。
将编号分别为1…N的N个对象划分为不相交集合,在每个集合中,选择其中某个元素代表所在集合。
常见两种操作:
- 合并两个集合
- 查找某元素属于哪个集合
算法实现
查找 Θ(1)
find1(x) { return set[x]; }
合并 Θ(N)
Merge1(a,b) { i = min(a,b); j = max(a,b); for (k = 1; k <= N; k++) { if (set[k] == j) set[k] = i; } }
对于“合并操作”,必须搜索全部元素!有没有可以改进的地方呢?
算法的优化
使用树结构
每个集合用一棵“有根树”表示,定义数组 set[1..n]
- set[i] = i , 则i表示本集合,并是集合对应树的根
- set[i] = j, j<>i, 则 j 是 i 的父节点.
查找 最坏情况Θ(N)
find2(x) { r = x; while (set[r] != r) r = set[r]; return r; }
合并 Θ(1)
merge2(a, b) { if (a<b) set[b] = a; else set[a] = b; }
性能有无本质的改进?如何避免最坏情况呢?
优化--避免最坏情况
效果:任意顺序的合并操作以后,包含k个节点的树的最大高度不超过lgk
优化后算法及效率:
查找 Θ(N)
find2(x) { r = x; while (set[r] != r) r = set[r]; return r; }
合并 Θ(1)
merge3(a,b) { if (height(a) == height(b)) { height(a) = height(a) + 1; set[b] = a; } else if (height(a) < height(b)) { set[a] = b; } else { set[b] = a; } }
进一步优化--路径压缩
- 第一步,找到根结点
- 第二步,修改查找路径上的所有节点,将它们都指向根结点
带路径压缩的查找算法:
find3(x) { r = x; while (set[r] != r) //循环结束,则找到根节点 r = set[r]; i = x; while (i != r) //本循环修改查找路径中所有节点 { j = set[i]; set[i] = r; i = j; } }
路径压缩示意图:
比较懒,转载于:http://www.cnblogs.com/archimedes/p/disjoint-set.html
以HDU1232为例
我的代码:
![](https://i-blog.csdnimg.cn/blog_migrate/8f900a89c6347c561fdf2122f13be562.gif)
![](https://i-blog.csdnimg.cn/blog_migrate/961ddebeb323a10fe0623af514929fc1.gif)
#include<stdio.h> int x[1005]; int min(int a,int b); int max(int a,int b); void xs(int a,int b); int fine(int a); int main() { int n,m,i,a,b; while(scanf("%d",&n)&&n) { int sum = -1; scanf("%d",&m); for(i=1;i<=n;i++) x[i]=i; /*首先把各自的父节点设为自身。*/ for(i=1;i<=m;i++) { scanf("%d%d",&a,&b); xs(a,b); /*合并两个集合。*/ } for(i=1;i<=n;i++) { if(x[i]==i) sum++; /*算出(最后不同集合的个数-1)即为所求。*/ } printf("%d\n",sum); } return 0; } int min(int a,int b) { return a<b ? a : b; } int max(int a,int b) { return a>b ? a : b; } int fine(int a) { if(x[a]==a) return a; else return fine(x[a]); } void xs(int a,int b) { x[max(fine(a),fine(b))] = min(fine(a),fine(b)); }