一、什么是并查集
1、概念
并查集是一种**树形**数据结构,主要用来解决一些不相交集合的合并问题。就是将两个不相交的两个集合合并成一个集合,这也是并操作;查操作就是查询两个元素是否同一个集合。把**相互联系**的元素通过特定查询组成一个集合,然后反复查找一个元素在哪个集合中。
2、经典例题
题目背景
若某个家族人员过于庞大,要判断两个是否是亲戚,确实还很不容易,现在给出某个亲戚关系图,求任意给出的两个人是否具有亲戚关系。
题目描述
规定: x x x 和 y y y 是亲戚, y y y 和 z z z 是亲戚,那么 x x x 和 z z z 也是亲戚。如果 x x x, y y y 是亲戚,那么 x x x 的亲戚都是 y y y 的亲戚, y y y 的亲戚也都是 x x x 的亲戚。
输入格式
第一行:三个整数 n , m , p n,m,p n,m,p,( n , m , p ≤ 5000 n,m,p \le 5000 n,m,p≤5000),分别表示有 n n n 个人, m m m 个亲戚关系,询问 p p p 对亲戚关系。
以下 m m m 行:每行两个数 M i M_i Mi, M j M_j Mj, 1 ≤ M i , M j ≤ N 1 \le M_i,~M_j\le N 1≤Mi, Mj≤N,表示 M i M_i Mi 和 M j M_j Mj 具有亲戚关系。
接下来 p p p 行:每行两个数 P i , P j P_i,P_j Pi,Pj,询问 P i P_i Pi 和 P j P_j Pj 是否具有亲戚关系。
输出格式
p
p
p 行,每行一个 Yes
或 No
。表示第
i
i
i 个询问的答案为“具有”或“不具有”亲戚关系。
样例 #1
样例输入 #1
6 5 3
1 2
1 5
3 4
5 2
1 3
1 4
2 3
5 6
样例输出 #1
Yes
Yes
No
题目中要判断两个人是否是亲戚关系,我们可以想象有亲戚关系的人同属一个家族,把家族抽象成数学上的集合,求解就是判断是否同在一个集合,最开始我们可以把每个人都看作是一个单独集合,两个人有亲戚关系(相互联系)那么就可以合并成一个集合,并需要标识这个新的集合(并操作),根据题目描述,x和y是亲戚,y和z是亲戚,则x和z是亲戚,通过这种规则,合并后x,y,z都是那么都同属一个集合;那么再庞大的家族关系,只要将有亲戚关系都合并到一个集合中,然后通过查找是否在新集合中,那么就可以判断两个人是否有亲戚关系(查操作)。
二、并查集的基本主要操作
1、初始化节点
/* 最开始每个元素都是一个单独的集合,array[i]中保存的是i集合的集合号(最初array[i]保存i集合本身) */
int array[64];
void init(int num)
{
/* 一般从1开始标识集合1,所以需要取等号 */
for (int i = 1; i <= num; i++) {
array[i] = i;
}
}
如下图
2、并操作
为什么要并操作?就是把相互有联系的集合合并成一个集合,以便后续通过查找判断是否在同一集合中,达到求解的目的。合并操作实际上就是将array[i]中的值改变,即
/* (x和y是有相互联系的)先把x和y元素所在的集合标号找出来,如果不在同一个集合标号中,则改变任意一个元素的集合标号,使其合并到同一个集合标号中 */
void merge(int x, int y)
{
int x_flag = find(x);
int y_flag = find(y);
if (x_flag != y_flag)
array[y] = x_flag;
}
3、查询操作
查操作是查找集合所在集合标号,如果集合本身指向自己,就是查找到了该集合标号,根据合并的规则,在初始化时,集合本身和集合标号相等;那么在查找的时候,该条件就是找到集合标号的判断条件。
如果合并后的集合如下图所示,1、2、3、4集合最终都属于1号集合,查找就需要一级一级查找,查找的时间和集合的个数成线性关系。
/* 递归查找比较难以理解,自身调用自身,可以假想在递归调用的时候是调其他函数,只不过函数实现都是一样的, 返回的时候也就是把结果退回到上层,上层接着运行而已,此时运行的环境全是上层的值,如果有兴趣看一看一下函数调用的本质,实际上为函数开辟一个栈空间保存函数执行所需值,由bsp和bep寄存器保存栈顶和栈底标识,在函数执行完毕,返回的时候自身栈销毁,自然bsp和bep就退回到上一个函数标识 */
int find(int x)
{
if (x == array[x]) {
return array[x];
}
/* 递归查找,如果不满足找到集合标号的条件,就应该继续找往上寻找 */
return find(array[x]);
}
优化查找,路径压缩,反正1、2、3、4都属于1号集合,那么3、4号集合可以直接保存1号集合标号,如何修改3号(array[3])和4号(array[4])集合中保存的值?合并的时候只能保存次级集合标号,只能在查找的时候,并且是在递归查找回归的时候不断更改。
4找3,
3找2,
2找1,
1属于1,找到集合标号,返回并且修改2的集合标号为1,3的集合标号为1,4集合的标号为1。
int find(int x)
{
if (x == array[x]) {
return array[x];
}
/* 递归查找,如果不满足找到集合标号的条件,就应该继续找往上寻找 并且更新该元素的标号为新集合标号 */
return array[x] = find(array[x]);
}
知道了并查集的主要操作,那么上面的找亲戚关系问题也就不难解了,代码实现如下:
#include<stdio.h>
#define NUM 5000
int group[NUM];
char *ret[NUM];
void init(int num)
{
for (int i = 0; i <= num; i++) {
group[i] = i;
}
return;
}
int find(int x)
{
if (x == group[x])
return group[x];
return group[x] = find(group[x]);
}
void merge(int x, int y)
{
int p_x = find(x);
int p_y = find(y);
/* 将y集合指向x所属的集合p_x,即将x和y合并到一个集合中 */
if (p_x != p_y)
group[y] = p_x;
}
int main(int argc, int *argv[])
{
int n, m, p;
int x, y;
int j;
scanf("%d%d%d", &n, &m, &p);
init(n);
for (int i = 0; i < m; i++) {
scanf("%d%d", &x, &y);
merge(x, y);
}
for (j = 0; j < p; j++) {
scanf("%d%d", &x, &y);
if(find(x) == find(y))
ret[j] = "Yes";
else
ret[j] = "No";
}
for (int j = 0; j < p; j++) {
printf("%s\n", ret[j]);
}
return 0;
}
除了上面的应用,并查集还可以解决图的连通性问题,最小生成树算法,朋友圈问题等,更多应用待研究