数据结构-并查集

一、并查集概述

  • 并查集代码很短,思维精巧,在面试和比赛当中是一种很常用的数据结构。

1. 定义

  • 并、查、集,这个三个字,其中前面两个字都是动词,第三个字是个名词。
  • 集就是集合,就是将一堆元素没有顺序地摆放在同一个地方。
  • 因此并查集的本质就是对集合进行操作。
  • 并查集是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题。常常在使用中以森林来表示。

2. 作用

  • (1) 将两个集合合并。
  • (2) 询问两个元素是否在一个集合当中

3. 主要操作

  • 初始化:把每个点所在集合初始化为其自身。通常来说,这个步骤在每次使用该数据结构时只需要执行一次,无论何种实现方式,时间复杂度均为 O(N) 。
  • 查找:查找元素所在的集合,即根节点。
  • 合并:将两个元素所在的集合合并为一个集合。通常来说,合并之前,应先判断两个元素是否属于同一集合,这可用上面的查找操作实现。

二、并查集思想

1. 暴力做法

  • 对于如下图所示的两个集合,如果我们要判断H和A是否在同一个集合中,我们需要遍历A所在的集合,并逐一判断当前节点是否是H节点,直到最后遍历完整个蓝色集合,才能判断出H节点不在这个集合中。

在这里插入图片描述

  • 同样的,如果我们需要合并两个集合,就需要遍历整个黄色的集合,将里面的节点一个一个加入到蓝色集合中。两者都是 O(N) 的时间复杂度。
  • 暴力做法一般是用来给我们提供优化的思路,整体比较简单易想,因此便不过多叙述。

2. 并查集做法

  • 在我们生成集合的时候,就人为地将集合中的元素之间创建某种关联。那么查询和合并的操作将会省时很多。形成如下图的结构:

在这里插入图片描述

  • 对结构进行优化,我们可以发现这两个结构其实就是一个树。会形成近乎 O(1) 的时间复杂度。

在这里插入图片描述

  • 对于每一个点,我们都存储一下他的父节点是谁,当我们想求某个点是否属于集合当中,也就是查询操作时,就可以根据这个点的父节点是不是根节点,如果不是,就继续向上查找,直到找到根节点为止,根节点的编号就是整个集合的编号。因此,可以用这种方式快速进行查询操作
  • 那么,便会产生如下问题:
  • (1) 如何判断是不是根节点? 答:if ( p[x] == x ) 。
  • (2) 如何求 x 的集合编号? 答:while ( p[x] != x) x = p[x] 。
  • (3) 如何合并两个集合? 答:将一个树根节点的父节点设为另一个树。即:px 是 x 的集合编号,py 是 y 的集合编号,使得 p[x] = y 。

3. 并查集优化

3.1 路径压缩

  • 思想:每次查找时,如果路径较长,则修改信息,以便下次查找的时候速度更快。
  • 实现:(1) 找到根节点。(2) 修改查找路径上的所有节点,将他们都指向根节点。

3.2 按秩合并(使用较少)

  • 很多人有一个误解,就是认为并查集经过路径压缩优化之后,并查集是只有两层的一颗树,其实不是的。因为路径压缩只在查找的时候进行,也只压缩一条路径,所有并查集的最终结构仍然可能是比较复杂的。
  • 思想:应该把简单的树往复杂的树上合并,即把树的深度小的树合并到树的深度大的树中,这样合并之后,每个元素到根结点的距离变成的元素个数最少。
  • 实现:用 rank[ ] 数组来记录每个根结点对应的树的深度(如果不是根结点,则 rank 中的元素大小表示的是以当前结点作为根结点的子树的深度);一开始,把所有元素的 rank 设为 1 ,即自己就为一颗树,且深度为 1 ;合并的时候,比较两个根结点,把 rank 较小者合并到较大者中去。

4. 并查集实现详见例题——合并集合

三、并查集例题——合并集合

题目描述

一共有 n 个数,编号是 1∼n,最开始每个数各自在一个集合中。
现在要进行 m 个操作,操作共有两种:

  • M a b,将编号为 a 和 b 的两个数所在的集合合并,如果两个数已经在同一个集合中,则忽略这个操作。
  • Q a b,询问编号为 a 和 b 的两个数是否在同一个集合中。

输入格式

第一行输入整数 n 和 m。
接下来 m 行,每行包含一个操作指令,指令为 M a bQ a b 中的一种。

输出格式

对于每个询问指令 Q a b,都要输出一个结果,如果 a 和 b 在同一集合内,则输出 Yes,否则输出 No
每个结果占一行。

数据范围

1 ≤ n,m ≤ 1e5

输入样例

4 5
M 1 2
M 3 4
Q 1 2
Q 1 3
Q 3 4

输出样例

Yes
No
Yes

具体实现

1. 实现思路

  • 见上文。

2. 代码注解

  • p[N] 是父节点数组。
  • p[i] = i 所有节点一开始赋值给自己。
  • int find (int x) 返回 x 的祖宗节点,包含路径压缩。
  • p[find(a)] = find(b) a 的祖宗节点的父节点等于 b 的祖宗节点,把 a 节点对应集合合并到 b 节点对应集合。
  • if (find(a) == find(b)) 如果 a 和 b 的祖宗节点一样的话,就说明在同一个集合里面。

3. 实现代码

#include <bits/stdc++.h>
using namespace std;

const int N = 100010;

int p[N];

int find (int x)
{
    if (p[x] != x) 
    {
        p[x] = find(p[x]);
    }
    return p[x];
}

int main()
{
    int n, m;
    cin >> n >> m;
    for (int i = 1; i <= n; i ++ ) 
    {
        p[i] = i;
    }

    while (m -- )
    {
        char op[2];
        int a, b;
        cin >> op >> a >> b;
        if (*op == 'M')
        {
            p[find(a)] = find(b);
        }
        else
        {
            if (find(a) == find(b)) 
            {
                puts("Yes");
            }
            else 
            {
                puts("No");
            }
        }
    }
    system("pause");
    return 0;
}

四、并查集例题——连通块中点的数量

题目描述

给定一个包含 n 个点(编号为 1∼n)的无向图,初始时图中没有边。
现在要进行 m 个操作,操作共有三种:

  • C a b,在点 a 和点 b 之间连一条边,a 和 b 可能相等;
  • Q1 a b,询问点 a 和点 b 是否在同一个连通块中,a 和 b 可能相等;
  • Q2 a,询问点 a 所在连通块中点的数量;

输入格式

第一行输入整数 n 和 m。
接下来 m 行,每行包含一个操作指令,指令为 C a bQ1 a bQ2 a 中的一种。

输出格式

对于每个询问指令 Q1 a b,如果 a 和 b 在同一个连通块中,则输出 Yes,否则输出 No
对于每个询问指令 Q2 a,输出一个整数表示点 a 所在连通块中点的数量。
每个结果占一行。

数据范围

1 ≤ n,m ≤ 1e5

输入样例

5 5
C 1 2
Q1 1 2
Q2 1
C 2 5
Q2 5

输出样例

Yes
2
3

具体实现

1. 样例模拟

  • 首先,有5个点:1 ,2 ,3 ,4 ,5 。
  • 将 1 和 2 之间连一条边。
  • 询问 1 和 2 是否在一个连通块当中,显然是的,返回 YES。
  • 询问 1 所在的连通块中点的数量,显然是 2 个点,1 和 2 。
  • 将 2 和 5 之间连一条边 。
  • 询问 5 所在连通块中点的数量,显然是 3 个点,1、2、3 。

在这里插入图片描述

2. 实现思路

  • 前两个操作与上一个例题 合并集合 是一样的,这里只需要考虑第三个,如何统计连通块当中点的个数。
  • 对每一个集合当中点的数量初始化为 1 。
  • 为了便于统计,只认为根节点集合当中点的数量是有意义的。
  • 当 a 集合插入到 b 集合当中时,就是 size[b] = size[b] + size[a] 。

3. 代码注解

  • size[N] 表示每一个集合当中点的数量,一开始均为 1 ,只统计根节点的。
  • 在我们执行 C 步骤时,就进行判断 if (find(a) == find(b)) { continue; } 如果 a 和 b 已经在一个集合里面了,就不要执行后面的步骤了。

4. 实现代码

#include <bits/stdc++.h>
using namespace std;

const int N = 100010;

int p[N]; 
int cont[N];

int find (int x)
{
    if (p[x] != x) 
    {
        p[x] = find(p[x]);
    }
    return p[x];
}

int main()
{
    int n, m;
    cin >> n >> m;
    for (int i = 1; i <= n; i ++ ) 
    {
        p[i] = i;
        cont[i] = 1;
    }

    while (m -- )
    {
        char op[5];
        int a, b;
        cin >> op;
        if (op[0] == 'C')
        {
        	cin >> a >> b;
        	if (find(a) == find(b))
        	{
        	    continue;
        	}
        	cont[find(b)] = cont[find(b)] + cont[find(a)];
            p[find(a)] = find(b);
        }
        else if (op[1] == '1')
        {
        	cin >> a >> b;
            if (find(a) == find(b)) 
            {
                puts("Yes");
            }
            else 
            {
                puts("No");
            }
        }
        else
        {
        	cin >> a;
        	cout << cont[find(a)] << endl;
        	
		}
    }
    system("pause");
    return 0;
}

五、并查集例题——食物链(较难)

题目描述

动物王国中有三类动物 A,B,C,这三类动物的食物链构成了有趣的环形。
A 吃 B,B 吃 C,C 吃 A。
现有 N 个动物,以 1∼N 编号。
每个动物都是 A,B,C 中的一种,但是我们并不知道它到底是哪一种。
有人用两种说法对这 N 个动物所构成的食物链关系进行描述:
第一种说法是 1 X Y,表示 X 和 Y 是同类。
第二种说法是 2 X Y,表示 X 吃 Y。
此人对 N 个动物,用上述两种说法,一句接一句地说出 K 句话,这 K 句话有的是真的,有的是假的。
当一句话满足下列三条之一时,这句话就是假话,否则就是真话。

  • 当前的话与前面的某些真的话冲突,就是假话;。
  • 当前的话中 X 或 Y 比 N 大,就是假话。
  • 当前的话表示 X 吃 X,就是假话。

你的任务是根据给定的 N 和 K 句话,输出假话的总数。

输入格式

第一行是两个整数 N 和 K,以一个空格分隔。
以下 K 行每行是三个正整数 D,X,Y,两数之间用一个空格隔开,其中 D 表示说法的种类。
若 D=1,则表示 X 和 Y 是同类。
若 D=2,则表示 X 吃 Y。

输出格式

只有一个整数,表示假话的数目。

数据范围

1 ≤ N ≤ 50000
0 ≤ K ≤ 100000

输入样例

100 7
1 101 1
2 1 2
2 2 3
2 3 3
1 1 3
2 3 1
1 5 5

输出样例

3

具体实现

1. 样例分析

  • 输入 N = 100 和 K = 7 ,表示,一共有 100 动物,要对 7 句话进行判断。
  • 第一句话: 第 101 个动物和第 1 个动物是同类,我们只有 100 个动物,显然是假话。
  • 第二句话: 表示 1 吃 2 。
  • 第三句话: 表示 2 吃 3 。
  • 第四句话: 表示 3 吃 3 ,显然是假话。
  • 第五句话: 表示 1 和 3 是同类,与前面 1 吃 2 ,2 吃 3 矛盾,为假话。
  • 第六句话: 表示 3 吃 1 。
  • 第七句话: 表示 5 和 5 是同类。
  • 所以输出 3 。

2. 实现思路

  • 1 吃 2,2 吃 3, 3 吃 1,构成一个环形。
  • 我们需要确定每个点和根节点的关系,就可以任意两个点之间的关系。
  • 由于 3 种动物相互循环被吃,因此,我们用每个点到根节点的距离,来表示他和根节点的关系。
  • 如果某个点到根节点的距离是 1 ,意思是他可以吃根节点。可以通过 % 3 = 1 来表示。
  • 如果某个点到根节点的距离是 2 ,意思是他被根节点吃。 可以通过 % 3 = 2 来表示。
  • 如果某个点到根节点的距离是 3 ,意思是他和根节点是同类。 可以通过 % 3 = 0 来表示。

3. 代码注解

  • p[N] 父节点数组。
  • d[N] 到根节点距离数组 。
  • t 表示询问种类,0表示同类,1表示吃的关系 。
  • p[i]=i 初始化,一开始每个点都是独立的,自己是自己的父节点
  • 在并查集函数当中:
  • int u = p[x] u记录旧的父节点。
  • p[x] = find(p[x]) 路径压缩,新父节点变成根节点了。
  • d[x] += d[u] x到新父节点的距离等于x到旧父节点的距离加上旧父节点到根节点的距离。

4. 实现代码

#include <bits/stdc++.h>
using namespace std;

const int N=50010;

int n,m;
int p[N];  // 父节点数组 
int d[N];  // 到根节点距离数组 

int find(int x)
{
	if(p[x]!=x)
	{
		int u = p[x];  // u记录旧的父节点
		p[x] = find(p[x]); // 路径压缩,新父节点变成根节点了
		d[x] += d[u];  // x到新父节点的距离等于x到旧父节点的距离加上旧父节点到根节点的距离
	}
	return p[x];
}

int main()
{
    cin>>n>>m;
    for(int i=1;i<=n;i++)
    {
    	p[i]=i;  //一开始每个点都是独立的,自己是自己的父节点 
	}
	int res=0;
	while(m--)
	{
		int t;//t表示询问种类,0表示同类,1表示吃的关系 
		int x;
		int y;
		cin>>t>>x>>y;
		
		if(x>n||y>n)
		{
			res++;
		}
		else
		{
			int px=find(x),py=find(y);
			if(t==1)
			{
				if(px==py&&(d[x]-d[y])%3!=0)
				{
					res++;
				}
				else if(px!=py)
				{
					p[px]=py;
                    d[px]=d[y]-d[x];
				}
			}
			else
            {
                if(px==py&&(d[x]-d[y]-1)%3!=0)
				{
					res++;
				}
                else if(px!=py)
                {
                    p[px] = py;
                    d[px] = d[y] + 1 - d[x];
                }
            }
		}
	}
	cout<<res<<endl;
    system("pause");
    return 0;
}
  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

虚心求知的熊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值