并查集
背景及意义
并查集,在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中。这一类问题近几年来反复出现在信息学的国际国内赛题中。其特点是看似并不复杂,但数据量极大,若用正常的数据结构来描述的话,往往在空间上过大,计算机无法承受;即使在空间上勉强通过,运行的时间复杂度也极高,根本就不可能在比赛规定的运行时间(1~3秒)内计算出试题需要的结果,只能用并查集来描述。
并查集是一种树型的数据结构,用于处理一些不相交集合(disjoint sets)的合并及查询问题。常常在使用中以森林来表示。
基本操作
初始化
把每个点所在集合初始化为其自身。
通常来说,这个步骤在每次使用该数据结构时只需要执行一次,无论何种实现方式,时间复杂度均为。
// 初始化,假定节点编号是1~n
for (int i = 1; i <= n; i ++ ) p[i] = i;
查找
查找元素所在的集合,即根节点。
// 返回x的祖宗节点
int find(int x)
{
if (p[x] != x) p[x] = find(p[x]);
return p[x];
}
合并
将两个元素所在的集合合并为一个集合。
通常来说,合并之前,应先判断两个元素是否属于同一集合,这可用上面的“查找”操作实现。
// 合并a和b所在的两个集合:
p[find(a)] = find(b); //将a集合祖宗节点连接到b的祖宗节点上
个人理解
每个节点初始化为一个集合,每个集合都有且唯一的祖宗节点(这个用来区分是否为同一集合)。多个节点为一个集合,集合是以树的形式存在,其中根节点就是该集合的祖宗节点。查找节点所属集合就是查找他的祖宗节点。每个节点都存放着他的父节点,也就是说了可以通过自身节点找到父节点(除了根节点,祖宗节点),递归查找父节点就可以找到根节点了。
合并两个集合的话就只需要将两个集合的根节点连接到一起。
题目
题目来源AcWing第827题
给定一个包含 n 个点(编号为 1∼n)的无向图,初始时图中没有边。
现在要进行 m 个操作,操作共有三种:
- C a b,在点 a 和点 b 之间连一条边,a 和 b 可能相等;
- Q1 a b,询问点 a 和点 b 是否在同一个连通块中,a 和 b 可能相等;
- Q2 a,询问点 a 所在连通块中点的数量;
输入格式
第一行输入整数 n 和 m。
接下来 m 行,每行包含一个操作指令,指令为 C a b,Q1 a b 或 Q2 a 中的一种。
输出格式
对于每个询问指令 Q1 a b,如果 a 和 b 在同一个连通块中,则输出 Yes,否则输出 No。
对于每个询问指令 Q2 a,输出一个整数表示点 a 所在连通块中点的数量
每个结果占一行。
数据范围
1 ≤ n,m ≤ 105
输入样例:
5 5
C 1 2
Q1 1 2
Q2 1
C 2 5
Q2 5
输出样例:
Yes
2
3
代码
#include <iostream>
using namespace std;
const int N = 100010;
int p[N];
int s[N];
//查找x所在连通块的祖宗节点
//祖宗节点特征 p[x] == x
int find(int x){
if(p[x] != x) p[x] = find(p[x]);
return p[x];
}
int main(){
int n, m;
scanf("%d%d", &n,&m);
for(int i = 1; i <= n;i ++){
p[i] = i;
s[i] = 1;//每个集合初始数量为1
}
while(m --){
char op[2];
int a,b;
scanf("%s", op);
if(op[0] == 'C') {
scanf("%d%d", &a,&b);
if(find(a) == find(b)) continue;
s[find(b)] += s[find(a)]; //将a连通块中个数加到b连通块上
p[find(a)] = find(b); // 将a连通块连接到b连通块上
}
else if(op[1] == '1'){
scanf("%d%d", &a,&b);
if(find(a) == find(b)) puts("Yes");
else puts("No");
}
else{
scanf("%d", &a);
printf("%d\n",s[find(a)]);
}
}
return 0;
}
解题思路
每个连通块为一个集合,要做的操作是合并集合,和查找两个节点是否在同一集合以及集合中有多少个节点。很明显前两个操作就是并查集的操作。后面要查询集合元素有多少,我们可以在建立一个数组表示某节点所在集合的数量,因为每个节点上都存放集合数量会造成数据重复,所以在每个集合的祖宗节点上在存放一个size[]数组就行。