点赞👍👍收藏🌟🌟关注💖💖
你的支持是对我最大的鼓励,我们一起努力吧!😃😃
并查集实际是一个森林,森林是由多棵互不相交的树组成的。那什么数据结构能把多颗树存下来呢?下面随着我们的学习就知道了。
1.并查集原理
在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集(union-find set)。
比如:某公司今年校招全国总共招生10人,西安招4人,成都招3人,武汉招3人,10个人来自不同的学校,起先互不相识,每个学生都是一个独立的小团体,去了之后因为地域问题大家吃饭不一样,因此分成了三个小团体。那怎么表示这三个不同的集合呢?
并查集!就是把不同的元素分到不同的集合。还涉及当两个集合有交集的时候还可能将集合合并。并查集查你在那个集合,还合并集合!
首先先给这些学生进行编号:{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}; 给以下数组用来存储该小集体,数组中的数字代表:该小集体中具有成员的个数。(负号下文解释)
可能会有这样的问题,内部给他们编号,万一外面给的是10个人给的是名字,我怎么知道谁是那个编号呢?怎么解决?
借助vector,map建立对应映射关系!
先把每个人名字用vector存起来,这样每个人都有了编号(下标),这样利用编号就很好找人了。那利用人找编号呢?使用map将人和编号建立映射关系。
template<class T>
class UnionFindSet
{
public:
UnionFindSet(const T* a, size_t sz)
{
for (int i = 0; i < sz; ++i)
{
_a.push_back(a[i]);
_IndexMap[a[i]] = i;
}
}
private:
vector<T> _a; //编号找人
map<T, int> _IndexMap; //人找编号
};
int main()
{
string arr[] = { "张三","李四","王五","赵六" };
UnionFindSet<string> ufs(arr, 4);
return 0;
}
这样不管是给下标还是给名字都可以解决这里的问题。
继续往下看,如何描述他们之间的关系呢?
西安学生小分队s1={0,6,7,8},成都学生小分队s2={1,4,9},武汉学生小分队s3={2,3,5}就相互认识了,10个人形成了三个小团体。假设右三个群主0,1,2担任队长,负责大家的出行。如何表示这三个集合呢?
很简单,把他们建立三颗树形结构。一个数据结构有多颗树不就是之前所说的森林了。如何建树呢?一个集体随便选取一个节点作根,剩下节点取做它的孩子。
那我们如何来表示这里的集合结构呢?
并查集是森林,森林是由多个树组成,这里用两层来表示这里的关系。
- 像堆类似,用数组下标表示关系
- 双亲表示法(存储双亲的下标)
合并过程:
比如说0和6先合并,将6位置的-1加到0位置,0位置就是-2,然后6位置保存0位置的下标。0和7合并也是将7位置的-1集到0位置,0位置就是-3,然后7位置保存0位置的下标。。。。
仔细观察数组中内融化,可以得出以下结论:
- 数组的下标对应集合中元素的编号
- 数组中如果为负数,负号代表根,数字代表该集合中元素个数
- 数组中如果为非负数,代表该元素双亲在数组中的下标
继续往下看,如何将已经有的集合合并呢? 刚才都是独立的集合直接合并,现在是已经有集合怎么合并呢?
比如说在公司工作一段时间后,西安小分队中8号同学与成都小分队4号同学奇迹般的走到了一起,两个小圈子的学生相互介绍,最后成为了一个小圈子:怎么合并呢?
不能直接合并,而是找到两个数的根,让根合并。
找根很简单,看自己位置保存的是不是负数,如果是负数自己就是根了,如果不是负数保存的就是双亲的下标了,就去看看双亲下标保存的是不是负数,不是负数还跳,直到找到双亲下标保存的值是负数,这个下标也就是根了。
把1下标的值加道0下标,然后1下标位置保存0下标。
通过以上例子可知,并查集一般可以解决一下问题:
- 查找元素属于哪个集合
沿着数组表示树形关系以上一直找到根(即:树中中元素为负数的位置) - 查看两个元素是否属于同一个集合
沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在 - 将两个集合归并成一个集合
将两个集合中的元素合并
将一个集合名称改成另一个集合的名称 - 集合的个数
遍历数组,数组中元素为负数的个数即为集合的个数。
下面就实现一下并查集
2.并查集实现
这里我们简单一些,不搞映射关系,假设它直接给的是下标。
class UnionFindSet
{
public:
UnionFindSet(int sz)
:_ufs(sz,-1)// 初始时,将数组中元素全部设置为1
{}
//合并集合
bool Union(int x1, int x2)
{
//找到对应的根,让根进行合并
int root1 = FindRoot(x1);
int root2 = FindRoot(x2);
// 如果本身就是在一个集合就没有必须合并了
if (root1 == root2)
return false;
//这里可以让小的做根
if(root1 > root2)
swap(root1,root2);
// 将两个集合中元素合并
_ufs[root1] += _ufs[root2];
// 将其中一个集合名称改变成另外一个
_ufs[root2] = root1;
return true;
}
// 给一个元素的编号,找到该元素所在集合的名称
int FindRoot(int x)
{
int parent = x;
while (_ufs[parent] >= 0)// 如果数组中存储的是负数,找到,否则一直继续
{
parent = _ufs[parent];
}
return parent;
}
bool IsSet(int x1, int x2)
{
return FindRoot(x1) == FindRoot(x2);
}
// 数组中负数的个数,即为集合的个数
size_t SetSize()
{
size_t sz= 0;
for (auto e : _ufs)
{
if (e < 0)
++sz;
}
return sz;
}
private:
vector<int> _ufs;
};
这里在补充说一点,并查集 路径压缩 的问题。比如集合是下面这个样子,要从9找到根需要跳很多层。影响找根的效率,能不能想到什么办法把路径压缩一下呢?
其实也很简单 ,反正都是在同一个集合,是不是直接可以考虑把下面的直接压到根的下面做根的孩子。这样就变成了一层。如果数据量很多层数很高压缩路径后这样很不错。
一般在查找根的时候去压缩。查找谁就把它这一条路径压缩。找到根之后判断一下,如果它的父亲就是根就不用压缩,如果不是说明中间有间隔层,然后就可以把这条路径压缩。比如是这个4,首先先把4变成2的孩子,然后将4的父亲1也去变成2的孩子,这条路径都可以变成2的孩子。
int FindRoot(int x)
{
int root = x;
while (_ufs[root] >= 0)// 如果数组中存储的是负数,找到,否则一直继续
{
root = _ufs[root];
}
//路径压缩
while (_ufs[x] >= 0)
{
int parent = _ufs[x];
_ufs[x] = root;
x = parent;
}
return root;
}
还有一种提高效率的方式,比如两个集合合并的时候,控制数据量小的向数据量大的合并。因为合并相当于一个集合向下压一层,是100个向下压一层还是20个向下压一层更好呢,显然是数据量小的向下压一层。
bool Union(int x1, int x2)
{
int root1 = FindRoot(x1);
int root2 = FindRoot(x2);
// x1已经与x2在同一个集合
if (root1 == root2)
return false;
//控制数据量小的往大的集合合并
if (abs(_ufs[root1]) < abs(_ufs[root2]))
{
swap(root1, root2);
}
// 将两个集合中元素合并
_ufs[root1] += _ufs[root2];
// 将其中一个集合名称改变成另外一个
_ufs[root2] = root1;
return true;
}
并查集完整代码
#pragma once
#include<iostream>
#include<vector>
#include<map>
using namespace std;
//template<class T>
//class UnionFindSet
//{
//public:
// UnionFindSet(const T* a, size_t sz)
// {
// for (int i = 0; i < sz; ++i)
// {
// _a.push_back(a[i]);
// _IndexMap[a[i]] = i;
// }
// }
//
//
//private:
// vector<T> _a; //编号找人
// map<T, int> _IndexMap; //人找编号
//};
class UnionFindSet
{
public:
UnionFindSet(int sz)
:_ufs(sz,-1)// 初始时,将数组中元素全部设置为1
{}
bool Union(int x1, int x2)
{
int root1 = FindRoot(x1);
int root2 = FindRoot(x2);
// x1已经与x2在同一个集合
if (root1 == root2)
return false;
//控制数据量小的往大的集合合并
if (abs(_ufs[root1]) < abs(_ufs[root2]))
{
swap(root1, root2);
}
// 将两个集合中元素合并
_ufs[root1] += _ufs[root2];
// 将其中一个集合名称改变成另外一个
_ufs[root2] = root1;
return true;
}
// 给一个元素的编号,找到该元素所在集合的名称
int FindRoot(int x)
{
int root = x;
while (_ufs[root] >= 0)// 如果数组中存储的是负数,找到,否则一直继续
{
root = _ufs[root];
}
//路径压缩
while (_ufs[x] >= 0)
{
int parent = _ufs[x];
_ufs[x] = root;
x = parent;
}
return root;
}
bool IsSet(int x1, int x2)
{
return FindRoot(x1) == FindRoot(x2);
}
// 数组中负数的个数,即为集合的个数
size_t SetSize()
{
size_t count = 0;
for (auto e : _ufs)
{
if (e < 0)
++count;
}
return count;
}
private:
vector<int> _ufs;
};
3.并查集应用
题目链接: LCR 116. 省份数量
题目描述:
这里我们就可以用到并查集的思想,将同一个省份的放到一个集合,最后在统计并查集中有几个集合就是省份的数量。
难道我们要自己手撕一个并查集写上去嘛?其实并不用,并查集中最重要的就是Findroot找根和合并集合。只要我们知道并查集内部怎么实现的,我们只用它的核心功能就可以了。
class Solution {
public:
int findCircleNum(vector<vector<int>>& isConnected) {
int n = isConnected.size();
// 手动控制并查集
vector<int> ufs(n,-1);
// 查找根
auto Findroot = [&](int x)
{
while(ufs[x] >= 0)
x = ufs[x];
return x;
};
for(int i = 0; i < isConnected.size(); ++i)
{
for(int j = 0; j < isConnected[i].size(); ++j)
{
if(isConnected[i][j] == 1)
{
// 合并集合
int root1 = Findroot(i);
int root2 = Findroot(j);
if(root1 != root2)
{
ufs[root1] += ufs[root2];
ufs[root2] = root1;
}
}
}
}
int count = 0;
for(auto e : ufs)
{
if(e < 0)
++count;
}
return count;
}
};
题目链接: 990. 等式方程的可满足性
题目描述:
它的意思就是让看一看,给的方程组有没有相背。就如 a == b,b != a 这给的就有问题。怎么用并查集解决这里的问题?
把所有元素看成独立的集合,我们可以把两个元素之间是相等关系的元素合并到同一个集合,如果两个元素之间是不相等的关系的元素出现在同一个集合就有问题了。
class Solution {
public:
bool equationsPossible(vector<string>& equations) {
//并查集的应用
vector<int> ufs(26,-1);
auto Findroot = [&](int x)
{
while(ufs[x] >= 0)
x = ufs[x];
return x;
};
//第一遍,先把相等的值加入到一个集合中
for(auto& str : equations)
{
if(str[1] == '=')
{
int root1 = Findroot(str[0] - 'a');
int root2 = Findroot(str[3] - 'a');
if(root1 != root2)
{
ufs[root1] += ufs[root2];
ufs[root2] = root1;
}
}
}
//第二遍,如果不相等的值在相同的集合,就违背了
for(auto& str : equations)
{
if(str[1] == '!')
{
int root1 = Findroot(str[0] - 'a');
int root2 = Findroot(str[3] - 'a');
if(root1 == root2)
return false;
}
}
return true;
}
};