并查集是一种树型的数据结构,用于处理一些不相交集集合(Disjoint Sets)的合并及查询问题。常常在使用中以森林来表示。
集就是让每个元素构成一个单元素的集合,也就是按一定顺序将属于同一组的元素所在的集合合并。
在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中。这一类问题近几年来反复出现在信息学的国际国内赛题中,其特点是看似并不复杂,但数据量极大,若用正常的数据结构来描述的话,往往在空间上过大,计算机无法承受;即使在空间上勉强通过,运行的时间复杂度也极高,根本就不可能在比赛规定的运行时间(1~3秒)内计算出试题需要的结果,只能用并查集来描述。
并查集通过一个一维数组实现,本质是维护一个森林,刚开始每个节点都是孤立的,然后逐渐将它们合并成一个大树,要遵循“靠左”和“擒贼先擒王”原则。
简单的示例代码如下:
#include<iostream>
using namespace std;
int f[1000] = { 0 }, m, n, k, sum = 0;
void init() {//初始化
int i;
for (i = 1; i <= n; i++)
f[i] = i;//数组存放自己的下标
}
int getf(int v) {//找父亲的递归函数,直到找到头(祖宗)
if (f[v] == v)
return v;
else {
f[v] = getf(f[v]);//这里是压缩路径,每次返回的时候把路上的老大改为最后找到的祖宗的编号,可以提高找到树的祖先的速度
return f[v];
}
}
void merge(int v, int u) {//合并两子集合
int t1, t2;
t1 = getf(v);
t2 = getf(u);
if (t1 != t2) //判断两者是否为同一个祖先
f[t2] = t1;//“靠左”原则,左边变为右边的老大,即把右边的集合作为左边的子集
}
int main() {
int i, x, y;
cin >> n >> m;//n是一共多少个人,m是一共几组
init();
for (i = 1; i <= m; i++) {//开始合并
cin >> x >> y;
merge(x, y);
}
for (i = 1; i <= n; i++) {//最后看有多少个独立的团伙
if (f[i] == i)
sum++;
}
cout << sum;
return 0;
}
输入:
10 9
1 2
3 4
5 2
4 6
2 6
8 7
9 7
1 6
2 4
输出: 3