并查集的定义
并查集,在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中。这一类问题近几年来反复出现在信息学的国际国内赛题中,其特点是看似并不复杂,但数据量极大,若用正常的数据结构来描述的话,往往在空间上过大,计算机无法承受;即使在空间上勉强通过,运行的时间复杂度也极高,根本就不可能在比赛规定的运行时间(1~3秒)内计算出试题需要的结果,只能用并查集来描述。
并查集是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。常常在使用中以森林来表示。(表示真心看不懂??)
其实并查集还是挺好理解的,所以我就不赘述那么多了。。。。。。
并查集能干什么
并查集是一种用来管理元素分组情况的数据结构,并查集可以高效地进行如下操作:
1:查询元素a和元素b是否属于同一组
2:合并元素a和元素b所在组
并查集的结构
并查集也是使用树形结构实现的
并查集支持的操作
合并
从一个组的根向另一个组的根连边,这样两棵树变成了一棵树,也就把两个组合并为一个组了。
查询
如果两个节点的根相同,就可以知道它们属于同一组。
并查集实现中的注意点
在树形数据结构中,如果发生了退化的情况,复杂度就会变得很高。在并查集中,可以按照如下
避免退化:
对于每棵树,记录这棵树的高度,合并时如果两棵树的高度不同,从高度小的向高度大的连边
void Union(int i, int j)
{
int i_root = Find(i);
int j_root = Find(j);
if (i_root == j_root)
return;
if (rank[i_root] > rank[j_root])
swap(i_root, j_root);
pre[i_root] = j_root;
if (rank[i_root] == rank[j_root]) // 两个秩相同的树合并,则整体的秩就会增加 1
rank[j_root]++;
}
路径压缩
在查询过程中向上经过的所有的节点,都改为直接连到根上
int Find(int i)
{
if (pre[i] == i)
return i;
int i_parent = pre[i];
int i_root = Find(i_parent);
pre[i] = i_root; // 路径压缩
return i_root;
}
其他方法
在维基上还有更多的优化方法,包括Path Having、Path Splitting等等。有要的同学可以翻墙看看。
代码实现
//initial the sets
void init(){
for(int i = 0; i < N; i++){
p[i] = i;
}
}
//Find(x) return the root of x
int Find(int x){
if(x == p[x]) return x;
else return p[x] = Find(p[x]);
}
//Union(x, y) union the sets of x and y
void Union(int x, int y){
int xRoot = Find(x);
int yRoot = Find(y);
if(xRoot == yRoot) return;
if(r[xRoot] < r[yRoot]) p[xRoot] = yRoot;
else if(r[xRoot] > r[yRoot]) p[yRoot] = xRoot;
else{
p[yRoot] = xRoot;
r[xRoot]++;
}
}
bool sameRoot(int x, int y){
//printf("root of %d: %d\n", x, Find(x));
//printf("root of %d: %d\n", y, Find(y));
return Find(x) == Find(y);
}