并查集是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。直接用一个实例来说明并查集相关的操作。
有如下图的结构,要判断图中是否有连通环的存在。
现在选取几条边,如下图红线所示,红线连接的两个数据之间可以建立树结构,因此选取这三条边之后可以画出两棵树结构,并将这两棵树的根节点合并,形成一棵树。我们可以注意到,此时1和3已经在此集合中且相关联,如果此时我们寻找2-4这条边,发现2和4的根节点都是3,说明他们两在同一个集合中,因此可以构成环。
算法步骤
上述过程可以总结为三个步骤:
①初始化数组。这里采用了一种很巧妙地方法,我们地目的是要找到每个数地根节点,子初始化时,我们将每个数的根节点都设置为本身,因此有以下形式,parent[0]=-1就表示0的根节点为本身,若0的根节点变为1,则parent[0]=1。
vector<int>parent(6,-1);
②查找根节点(find_root)。查找一条边中的两个数的根节点,返回根节点的值。
int Find_root(int x,vector<int>parent)
{
int x_root = x;
while (parent[x_root] != -1)
{
x_root = parent[x_root];
}
return x_root;
}
③合并根节点(union_root)。合并两个子集的根节点形成新的集合。因此在上面两个子集合并后,parent数组发生了变化,如下图所示
//返回true说明存在环;返回false说明不存在
bool Union(int x, int y, vector<int>&parent)
{
int x_root = Find_root(x,parent);
int y_root = Find_root(y, parent);
if (x_root == y_root)
return true;
else {
parent[x_root]=y_root;
return false;
}
}
进行优化,提高效率
上述步骤基本上就能实现并查集算法,但是还有优化的空间,称之为路径压缩。
假设我们在合并根节点时,有如下情况,这还是只有少数数据的情况,因此在合并时我们必须考虑的一个问题是,究竟应该把谁当作根节点?我们知道,在搜索根节点时,效率与树的深度相关,因此,合并后的树的深度的大小是决定谁是根节点的关键。
假设有下面两颗树,我们看以下两种合并情况下,合并后的树的深度情况,可以看出,当x为根节点时,合并后的树的深度不变,而y为根节点时,合并后的树深度增加了,这显然会影响后续find_root的效率,因此在union_root时选择深度更大的那颗树的根节点作为合并后的树的根节点。
初始化一个rank[]数组用于存储深度信息,初始值为0,因此union_root有以下改进代码:
bool Union(int x, int y, vector<int>&parent,vector<int>&rank)
{
int x_root = Find_root(x,parent);
int y_root = Find_root(y, parent);
if (x_root == y_root)
return true;
else {
if (rank[x_root] > rank[y_root])
parent[y_root] = x_root;
else if(rank[x_root] < rank[y_root])
parent[x_root] = y_root;
else
{
parent[x_root] = y_root;
rank[y_root]++;
}
return false;
}
}
完整代码及测试
#include<iostream>
#include<vector>
using namespace std;
//寻找根节点
int Find_root(int x,vector<int>parent)
{
int x_root = x;
while (parent[x_root] != -1)
{
x_root = parent[x_root];
}
return x_root;
}
//连接两个根节点
//返回true说明存在环;返回false说明不存在
bool Union(int x, int y, vector<int>&parent,vector<int>&rank)
{
int x_root = Find_root(x,parent);
int y_root = Find_root(y, parent);
if (x_root == y_root)
return true;
else {
if (rank[x_root] > rank[y_root])
parent[y_root] = x_root;
else if(rank[x_root] < rank[y_root])
parent[x_root] = y_root;
else
{
parent[x_root] = y_root;
rank[y_root]++;
}
return false;
}
}
测试代码及结果:
int main()
{
vector<int>parent(6,-1);
vector<int>rank(6,0);
int nums[6][2] = { {0,1},{1,2},{1,3},{2,4},{3,4},{2,5} };
//遍历每条边
for (int i = 0; i < 6; i++)
{
int x = nums[i][0];
int y = nums[i][1];
if (Union(x, y, parent, rank) == true)
{
cout << "loop existed" << endl;
exit(0);
}
}
cout << "NO loop found!" << endl;
system("pause");
return 0;
}
当删除2-4这条边后
int main()
{
vector<int>parent(6,-1);
vector<int>rank(6,0);
int nums[5][2] = { {0,1},{1,2},{1,3},{3,4},{2,5} };
for (int i = 0; i < 5; i++)
{
int x = nums[i][0];
int y = nums[i][1];
if (Union(x, y, parent, rank) == true)
{
cout << "loop existed" << endl;
exit(0);
}
}
cout << "NO loop found!" << endl;
system("pause");
return 0;
}