并查集是一种数据结构
并(Union),代表合并
查(Find),代表查找
集(Set),代表这是一个以字典为基础的数据结构,它的基本功能是合并集合中的元素,查找集合中的元素
并查集的典型应用是有关连通分量的问题
并查集解决单个问题(添加,合并,查找)的时间复杂度都是O(1)O(1)O(1)
因此,并查集可以应用到在线算法中
并查集跟树有些类似,只不过她跟树是相反的。在树这个数据结构里面,每个节点会记录它的子节点。在并查集里,每个节点会记录它的父节点。
class UnionFind{
private:
// 记录父节点
unordered_map<int,int> father;
};
当把一个新节点添加到并查集中,它的父节点应该为空
void add(int x){
if(!father.count(x)){
father[x] = -1;
}
}
如果发现两个节点是连通的,那么就要把他们合并,也就是他们的祖先是相同的。这里究竟把谁当做父节点一般是没有区别的。
void merge(int x,int y){
int root_x = find(x);
int root_y = find(y);
if(root_x != root_y){
father[root_x] = root_y;
}
}
我们判断两个节点是否处于同一个连通分量的时候,就需要判断它们的祖先是否相同
bool is_connected(int x,int y){
return find(x) == find(y);
}
查找祖先的方法是:如果节点的父节点不为空,那就不断迭代
int find(int x){
int root = x;
while(father[root] != -1){
root = father[root];
}
return root;
}
这里有一个优化的点:如果我们树很深,比如说退化成链表,那么每次查询的效率都会非常低。所以我们要做一下路径压缩。也就是把树的深度固定为二。
这么做可行的原因是,并查集只是记录了节点之间的连通关系,而节点相互连通只需要有一个相同的祖先就可以了。
路径压缩可以用递归,也可以迭代。这里用迭代的方法。
int find(int x){
int root = x;
while(father[root] != -1){
root = father[root];
}
// 路径压缩
while(x != root){
int original_father = father[x];
father[x] = root;
x = original_father;
}
return root;
}
完整模板
class UnionFind{
public:
int find(int x){
int root = x;
while(father[root] != -1){
root = father[root];
}
while(x != root){
int original_father = father[x];
father[x] = root;
x = original_father;
}
return root;
}
bool is_connected(int x,int y){
return find(x) == find(y);
}
void merge(int x,int y){
int root_x = find(x);
int root_y = find(y);
if(root_x != root_y){
father[root_x] = root_y;
}
}
void add(int x){
if(!father.count(x)){
father[x] = -1;
}
}
private:
// 记录父节点
unordered_map<int,int> father;
};
并查集一般有两种优化,这里规范一下表达:
「路径压缩」:在并查集中查找代表元素时,会将经过的所有元素「直接」连接到代表元素,也就是将连通分量「压扁」。
「按秩合并」:在并查集中合并两个连通分量时,将「秩」小的连通分量合并到「秩」大的连通分量上面。这里「秩」可以定义为连通分量的大小(包含的节点数量),或者连通分量的高度(连通分量是树的结构,因此可以定义高度。不过在「路径压缩」优化的基础上,这个高度会不断减小,但我们不用去时刻维护它,这样也可以达到最优的时间复杂度是已经被证明的了)。
当并查集中的元素个数为 n 时,下面的表格给出了单次并查集操作的时间复杂度