一、并查集简介
并查集,处理一些不相交集合(Disjoint Sets)的合并及查询问题。常用于判断无向图中连通分量的个数和任意两个顶点是否连通。
二、并查集操作
-
初始化:把每个元素所在集合初始化为其自身
-
合并(Union):把两个不相交的集合合并成一个集合,通常,合并之前会检查两个元素是否属于同一个集合。
-
查询(Find):查询元素所在的集合(代表节点/代表元),也可以用于判断两个元素是否属于同一个集合。
-
路径压缩(find):查找时,使节点x到root之间的所有节点都指向root。
-
按秩合并(union) :合并时,将层次少的集合合并到层次多的集合。
三、并查集森林与代表元
- 并查集森林:并查集(S)由若干子集合(si)构成,并查集的逻辑结构是一个森林,每个子集合就是一个树(连通子图)。
- 代表元:用集合中的一个元素——通常是root(树根)代表集合。该子集中所有节点的父节点都直接或间接指向代表元。若父节点等于节点本身,则该节点就是代表元。
四、代码实现
class UnionFindSet {
int[] parent;
int[] rank;
int count; // 小集合的个数
public UnionFindSet(char[][] grid) {
count = 0;
int m = grid.length;
int n = grid[0].length;
parent = new int[m * n];
rank = new int[m * n];
for (int i = 0; i < m; ++i) {
for (int j = 0; j < n; ++j) {
int value = hash(i, j, n);
if (grid[i][j] == '1') { // 只需要处理陆地节点
// 由于不关心节点的值,这里存储封装后的索引
parent[value] = value;
++count; // 小集合的个数+1
}
rank[value] = 1;
}
}
}
//为什么要使用hash来进行映射,因为坐标是二维数据,如果只是一维数据可以直接用变量i来存储
public int hash(int x, int j, int constant) {
return x * constant + j;
}
public void union(int x, int y) {
// 1.分别获取两个节点的代表节点
int rootX = find(x);
int rootY = find(y);
// 2.不属于同一个集合,才进行合并
if (rootX != rootY) {
if (rank[rootX] > rank[rootY]) {
parent[rootY] = rootX;
} else if (rank[rootX] < rank[rootY]) {
parent[rootX] = rootY;
} else {
parent[rootY] = rootX;
rank[rootX] += 1;
}
// 3.集合合并,数量减1
--count;
}
}
public int find(int i) {
if (parent[i] != i)
parent[i] = find(parent[i]);
return parent[i];
}
public int getCount() {
return count;
}
}
五、并查集链表实现思路
使用链表结构来实现并查集
• 每个集合是一个链表(head,tail)
• 集合的代表节点为链表头节点
• 链表节点对象应包含数据域(集合元素)、 next指针、back指针(指向head)
• 合并:将长度短的链表合并到长的链表后,修改短链表所有节点的back指针
• 查找:沿着back指针返回集合对象,返回链表head指向的元素