并查集原理
在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集(union-find set)。
示例:
工作时将10人分配成3个组,第一组 s1={0,6,7,8} ,第二组 s2={1,4,9},第三组 s3={2,3,5} ,这三个组分别以0,1,2当组长。
集合的树形表示
集合s1,s2,s3的森林父指针数组表示
从上图可以看出:编号6,7,8同学属于0号小分队,该小分队中有4人(包含队长0);编号为4和9的同学属于1号小分队,该小分队有3人(包含队长1),编号为3和5的同学属于2号小分队,该小分队有3个人(包含队长1)。
仔细观察数组可得出如下结论
- 数组的下标对应集合中元素的编号
- 数组中如果为负数,负号代表根,数字代表该集合中元素个数
- 数组中如果为非负数,代表该元素双亲在数组中的下标
由于第一组的任务太重,把第三组安排到第一组中,情况如下
现在0集合有7个人,2集合有3个人,总共两个组。
通过以上述示例可知,并查集一般可以解决以下问题
- 查找元素属于哪个集合
沿着数组表示树形关系以上一直找到根(即:树中中元素为负数的位置)
- 查看两个元素是否属于同一个集合
沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在
- 将两个集合归并成一个集合
先将两个集合中的元素合并,再将一个集合名称改成另一个集合的名称
- 集合的个数
遍历数组,数组中元素为负数的个数即为集合的个数。
并查集实现
class UnionFindSet
{
public:
// 初始时,将数组中元素全部设置为1
UnionFindSet(size_t n)
:_ufs(n, -1)
{}
void Union(int x1, int x2)
{
int root1 = FindRoot(x1);
int root2 = FindRoot(x2);
// 本身在一个集合就没必要合并了
if (root1 == root2) return;
// 数量多的合并数量少的
if (root1 > root2)
swap(root1, root2);
// 将两个集合中元素合并
_ufs[root1] += _ufs[root2];
// 将其中一个集合名称改变成另外一个
_ufs[root2] = root1;
}
// 给一个元素的编号,找到该元素所在集合的名称
int FindRoot(int x)
{
// 如果数组中存储的是负数,找到,否则一直继续
int root = x;
while (_ufs[root] >= 0)
{
root = _ufs[root];
}
// 路径压缩
while (_ufs[x] >= 0)
{
int parent = _ufs[x];
_ufs[x] = root;
x = parent;
}
return root;
}
bool InSet(int x1, int x2)
{
return FindRoot(x1) == FindRoot(x2);
}
// 数组中负数的个数,即为集合的个数
size_t SetSize()
{
size_t size = 0;
for (size_t i = 0; i < _ufs.size(); i++)
{
if (_ufs[i] < 0)
{
++size;
}
}
return size;
}
private:
vector<int> _ufs;
};
并查集应用
class Solution {
public:
int findCircleNum(vector<vector<int>>& isConnected) {
vector<int> ufs(isConnected.size(),-1);
auto findRoot=[&ufs](int x)
{
while(ufs[x]>=0) x=ufs[x];
return x;
};
for(size_t i=0;i<isConnected.size();i++)
{
for(size_t j=0;j<isConnected[0].size();j++)
{
if(isConnected[i][j]==1)
{
// 合并集合
int root1=findRoot(i);
int root2=findRoot(j);
if(root1!=root2)
{
ufs[root1]+=ufs[root2];
ufs[root2]=root1;
}
}
}
}
int n=0;
for(auto e:ufs)
{
if(e<0) n++;
}
return n;
}
};
class Solution {
public:
bool equationsPossible(vector<string>& equations) {
vector<int> ufs(26,-1);
auto findRoot=[&ufs](int x)
{
while(ufs[x]>=0)
{
x=ufs[x];
}
return x;
};
// 把相等的值加到一个集合
for(auto& str:equations)
{
if(str[1]=='=')
{
int root1=findRoot(str[0]-'a');
int root2=findRoot(str[3]-'a');
if(root1!=root2)
{
ufs[root1]+=ufs[root2];
ufs[root2]=root1;
}
}
}
// 不相等的值在一个集合就相悖
for(auto& str:equations)
{
if(str[1]=='!')
{
int root1=findRoot(str[0]-'a');
int root2=findRoot(str[3]-'a');
if(root1==root2) return false;
}
}
return true;
}
};