目录
1.概念
并查集(Union Find)是一种用于管理分组的数据结构。
它具备两个操作:(1)查询元素a和元素b是否为同一组
(2) 将元素a和b合并为同一组。注意:并查集不能将在同一组的元素拆分为两组。
2.并查集的结构
并查集可以使用树来实现。
使用树形结构来表示以后,每一组都对应一棵树,然而我们就可以将这个问题转化为树的问题了,我们看两个元素是否为一组我们只要看这两个元素的根是否一致。显然,使用树形结构将问题简单化了。合并时是我们只需要将一组的根与另一组的根相连即可。
3.并查集的实现
1)初始化节点
int node[i]; //每个节点
//初始化n个节点
void Init(int n){
for(int i = 0; i < n; i++){
node[i] = i;
}
}
2)查找当前元素所在树的根节点
int find(int x){
if(x == node[x])
return x;
return find(node[x]);
}
3)合并元素x, y所处的集合
void Unite(int x, int y){
//查找到x,y的根节点
x = find(x);
y = find(y);
if(x == y)
return ;
//将x的根节点与y的根节点相连
node[x] = y;
}
4)判断是否为同一个集合
bool same(int x, int y){
return find(x) == find(y);
}
4.并查集的优化
细心的同学会发现,我们使用以上的代码来实现并查集,会出现一个问题 --- 树的退化。在树形数据结构中,如果发生退化,那么复杂度将会变得很高(最惨的是直接退化成线性结构)。因此我们必须设法,阻止这种退化。为此我们这里有两种方法。
i. 对于每一棵树,我们记录它的高度(rank)。在每次合并操作时,将高度小的树放在高度高的树 下,成为它的子树:
通过这样处理之后,可以有效的防止树的退化,但是查询效率还不够快,于是我们有提出了第二种优化方案。
ii. 路径压缩
我们将原先间接与根相连的节点,让它与根直连,这样效率又可以大大的提高了:
我们在第一次查询时,进行这步操作,当再次查询时,就大大提高了效率。
5.并查集的复杂度
加入这两个优化之后,并查集的效率就非常高。对n个元素的并查集操作一次的复杂度是: O(α(n))。这里,α(n)是阿克曼(Ackermann)函数的反函数。效率要高于O(log n)。
不过这里O(α(n))是平均复杂度。也就是说,多次操作之后平均复杂度为O(α(n)),换而言之,并不是每一次操作都满足O(α(n))。
6.优化后的并查集实现
int node[i]; //每个节点
int rank[i]; //树的高度
//初始化n个节点
void Init(int n){
for(int i = 0; i < n; i++){
node[i] = i;
rank[i] = 0;
}
}
//查找当前元素所在树的根节点(代表元素)
int find(int x){
if(x == node[x])
return x;
return node[x] = find(node[x]); //在第一次查找时,将节点直连到根节点
}
//合并元素x, y所处的集合
void Unite(int x, int y){
//查找到x,y的根节点
x = find(x);
y = find(y);
if(x == y)
return ;
//判断两棵树的高度,然后在决定谁为子树
if(rank[x] < rank[y]){
node[x] = y;
}else{
node[y] = x;
if(rank[x] == rank[y])
rank[x]++:
}
}
//判断x,y是属于同一个集合
bool same(int x, int y){
return find(x) == find(y);
}