并查集
1. 并查集定义
并查集,在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中。这一类问题近几年来反复出现在信息学的国际国内赛题中,其特点是看似并不复杂,但数据量极大,若用正常的数据结构来描述的话,往往在空间上过大,计算机无法承受;即使在空间上勉强通过,运行的时间复杂度也极高,根本就不可能在比赛规定的运行时间(1~3秒)内计算出试题需要的结果,只能用并查集来描述。 (摘自百度)
说简单点,并查集是一种树形结构,常用于处理不相交集合的合并及查询问题。
并查集的操作:
- 查找(Find):查询两个元素是否在同一个集合中
- 合并(Union):把两个不相交的集合合并为一个集合
2. 并查集思想
并查集往往采用大哥小弟的例子来解释。
这里有个经典例子;
简单而言,每个小弟都有属于自己的大哥,每次合并时,就需要将大哥拉出来打一架,打完就选出一个真大哥,大家合并为一个社团。
3. 并查集实现
3.1 初始化
采用数组作为数据结构,首先每个人都是自己的大哥。
#define MAXN 100
int Parent[MAXN];// 底层采用int数组
void init(int n){
for(int i=0;i<n;i++){
Parent[i]=i; //存放每个结点的结点(或双亲结点)
}
}
并查集的基本工作原理
- 每个元素都可以看成一个集合
- 一开始每个元素各自作为一个单元素的集合
- 可以通过union操作来合并两个集合
- find操作可以检测两个元素是否属于同一个集合
并查集的C++实现
可以用一个数组来表示并查集,见下面的代码:
class DisjointSet {
private:
vector<int> parent;
public:
DisjointSet(int size) {
for (int i = 0; i < size; i++) {
parent.push_back(i);
}
}
int find(int x) {
if (parent[x] != x) {
parent[x] = find(parent[x]);
}
return parent[x];
}
void union(int x, int y) {
int rootX = find(x);
int rootY = find(y);
if (rootX != rootY) {
parent[rootY] = rootX;
}
}
};
- parent[i]表示元素i所在集合的代表元素(也叫根节点)。
- 一开始每个元素的根节点都是自己,表示每个元素单独形成一个集合。
- find操作通过递归查找根节点,进行路径压缩(直接连接到根)。
- union操作则将两个集合的根节点统一,即合并两个集合。
并查集的优化 - 按秩合并:合并时优先连接秩较小的树到秩较大的树上,可以降低树高。
- 路径压缩:在find时直接将节点连接到根上,减少后续搜索时间。
并查集经过优化后效率很高,各操作的时间复杂度只有O(1)到O(logn)。
并查集的应用 - 检测图的连通分量
- Kruskal最小生成树算法
希望这些内容可以帮助大家理解并查集的基本用法!它是一种非常有用的数据结构,值得我们深入学习。