1. 简述
并查集是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。常常在使用中以森林来表示。
需要实现的操作有:合并两个集合,判断两个元素是否属于一个集合。
这里介绍的主要是普通的并查集,很多情况下使用的并查集是需要扩展的,根据使用情况的不同,有很多差别,这里仅仅是最基本的算法。
2. 复杂度
T=O(n*α(n)) , 其中α(x),对于x=宇宙中原子数之和,α(x)不大于4。事实上,路经压缩后的并查集的复杂度是一个很小的常数。
3. 伪代码
没有使用路径压缩和启发式的方法。
// 初始化并查集
#define N 100
int father[N];
void init() {
for(int i=0; i<N; i++)
father[i] = i;
}
//
合并两个元素所在的集合
void union( int x, int y) {
x = getfather(x);
y = getfather(y);
if (x != y )
father[x] = y;
}
// 判断两个元素是否属于同一个集合
bool same( int x, int y) {
return getfather(x) == getfather(y);
}
// 获取根结点
int getfather( int x) {
while (x != father[x] )
x = father[x];
return x;
}
void union( int x, int y) {
x = getfather(x);
y = getfather(y);
if (x != y )
father[x] = y;
}
// 判断两个元素是否属于同一个集合
bool same( int x, int y) {
return getfather(x) == getfather(y);
}
// 获取根结点
int getfather( int x) {
while (x != father[x] )
x = father[x];
return x;
}
使用路径压缩,改进getfather。
//
获取根结点
int getfather( int x) {
if (x != father[x])
father[x] = getfather(father[x]); // 路径压缩修改的是father数组
int getfather( int x) {
if (x != father[x])
father[x] = getfather(father[x]); // 路径压缩修改的是father数组
return
father[x];
}
}
另外,还可以改进union,把数量少的集合合并到数量大的集合中,不过这就要记录每个集合中的元素数量,相当于增加了O(N)的存储空间,而且在getfather中也应该保持对元素数量的维护,相对代码复杂度偏高,而且感觉性能提升不多,这里就不写了。
4. 参考资料
维基百科