一、概念
并查集是一种树型的数据结构,用于处理不相交集合的合并和查询问题,速度很快,有很多应用,其中kruskal(最小生成树)算法最为广泛。
有关并查集的入门可以先看这一篇:并查集详解(超级简单有趣~~就学会了)
并查集的三个基本操作:
总结起来就是make-find-union。具体理解如下。
1、Make_Set(x) 把每一个元素初始化为一个集合
初始化后每一个元素的父亲节点是它本身,每一个元素的祖先节点也是它本身(也可以根据情况而变)。
2、Find_Set(x) 查找一个元素所在的集合
查找一个元素所在的集合,其精髓是找到这个元素所在集合的祖先!这个才是并查集判断和合并的最终依据。
判断两个元素是否属于同一集合,只要看他们所在集合的祖先是否相同即可。
合并两个集合,也是使一个集合的祖先成为另一个集合的祖先.
3、Union(x,y) 合并x,y所在的两个集合
合并两个不相交集合操作很简单:
利用Find_Set找到其中两个集合的祖先,将一个集合的祖先指向另一个集合的祖先。如图:
并查集的优化
1、Find_Set(x)时 路径压缩
寻找祖先时我们一般采用递归查找,但是当元素很多亦或是整棵树变为一条链时,每次Find_Set(x)都是O(n)的复杂度,有没有办法减小这个复杂度呢?
答案是肯定的,这就是路径压缩,即当我们经过"递推"找到祖先节点后,"回溯"的时候顺便将它的子孙节点都直接指向祖先,这样以后再次Find_Set(x)时复杂度就变成O(1)了,如下图所示;可见,路径压缩方便了以后的查找。
2、Union(x,y)时 按秩合并
即合并的时候将元素少的集合合并到元素多的集合中,这样合并之后树的高度会相对较小。
注意:
注意:
代码中路径压缩时秩不需变化的,秩只是表示节点高度的一个上界。
两个集合合并的时候,因为所属集合的根节点的秩在合并时已经更新,其他子节点的秩不用到也无需再变化。
#include <stdio.h>
#define MAX 1024
int father[MAX];
int rank[MAX];
void make_set(int x) {
father[x] = x; //创建一个新集合的时候,
rank[x] = 1;
}
// 递归版本
int find_set(int x) {
if (x != father[x]) {
father[x] = find_set(father[x]); //路径压缩的核心
}
return father[x];
}
// 非递归版本
int find_set_2(int x) {
int root = x,tmp;
while (root != father[root])
root = father[root];
//路径压缩
while (father[x] != root) {
tmp = father[x];
father[x] = root;
x = tmp;
}
return root;
}
void union_set(int x, int y) {
x = find_set(x);
y = find_set(y);
if (x == y) return;
if (rank[x] > rank[y]) {
father[y] = x;
}
else {
if (rank[x] == rank[y]) {
rank[y]++;
}
father[x] = y;
}
}
例题,我想去旅行(ACM)
描述
五一快到咯,大家都在计划着去哪里玩。曼曼呢,也在计划着出去玩,听说欧洲很浪漫,他就想趁这几天去欧洲几个国家玩玩。但是呢,有一个问题就是,他不知道他的钱在他想去的几个国家是否可以用。请你帮他判定一下他是否决定要不要去这几个国家旅游(假设两个国家的货币可以相互兑换,则表示他的钱可以在这两个国家使用)
输入
输入包括多组数据,每组数据第一行是两个数N,M(代表他一共想去N个国家,其中有M种兑换方式,(1<=N<=10,0<=M<=20),接下来的M行,每行输入2个数据,a,b,代表a,b两国之间的货币可以相互兑换。0代表的是EE所在的国家。
输出
曼曼是否可以去他想去的这几个国家旅游,如果可以,则输出yes!,否则输出sorry!。每个输出占一行。
样例输入
3 4
0 3
1 2
2 3
0 1
样例输出
yes!
#include <iostream>
#define N 11
using namespace std;
int father[N];
int find_set(int x) {
if (x != father[x]) {
father[x] = find_set(father[x]); //路径压缩的核心
}
return father[x];
}
int main() {
int n, m, a, b;
while (1) {
cout << "请输入要去的城市个数和兑换钱币的方案数: " << endl;
cin >> n >> m;
//制作集合
for (int i = 0; i <= n; i++) {
father[i] = i;
}
//合并集合
int tmp = m;
while(m--) {
cout << "第" << tmp-m << "种钱币兑换的方案: " << endl;
cin >> a >> b;
a = find_set(a); //查找跟节点
b = find_set(b);
if (a != b)
father[a] = b;
}
//查看所有节点是否具有相同的根节点
int root = find_set(0);
while (n--) {
if (root != find_set(n)) {
cout << "sorry!" << endl;
return -1;
}
}
cout << "yes!!" << endl;
return 0;
}
}
例二,小米面试题
假如已知有n个人和m对好友关系。如果两个人是直接或间接的好友(好友的好友的好友…),则认为他们属于同一个朋友圈,请写程序求出这n个人里一共有多少个朋友圈。假如:n = 5,m = 3,r = {{1 , 2} , {2 , 3} , {4 , 5}},表示有5个人,1和2是好友,2和3是好友,4和5是好友,则1、2、3属于一个朋友圈,4、5属于另一个朋友圈,结果为2个朋友圈。
#include <iostream>
#define N 1024
using namespace std;
int father[N];
int find_set(int x) {
if (x != father[x]) {
father[x] = find_set(father[x]); //路径压缩的核心
}
return father[x];
}
int main() {
int n, m, a, b;
while (1) {
cout << "请输入人数和好友的对数: " << endl;
cin >> n >> m;
//制作集合
for (int i = 1; i <= n; i++) {
father[i] = i;
}
//合并集合
int tmp = m;
while (m--) {
cout << "第" << tmp - m << "对好友关系: " << endl;
cin >> a >> b;
a = find_set(a); //查找跟节点
b = find_set(b);
if (a != b)
father[a] = b;
}
//查看有多少根节点
int count = 0;
for (int i = 1; i <= n; i++) {
if (father[i] == i) count++;
}
cout << "朋友圈的个数是:"<< count << endl;
return 0;
}
}