并查集
一,定义
并查集(union-find disjoint sets)是一种经典的数据结构,它非常适合用来解决集合合并与查找的问题。
它有三类操作:
Make-set(a):生成包含一个元素a的集合S;
Union(X, Y):合并两个集合X和Y;
Find(a):查找元素a所在集合S,即通过元素找集合句柄.
二,有根树实现
有根树的元素 数据结构是通过儿子节点,指向父亲节点。
element{
int data;
element* parent;
}
假设有以下两个集合:
S1={7,0,2,4,12,14};S2={1,6}
-
所有的元素,都通过parent指针指向集合的首个元素,所有元素的Find(a)的时间复杂度也是O(1)。
-
集合合并时,直接将s2的"1",指向s2的首个元素即可(此处使用了“按秩合并”,节点数少的有根树,指向节点数多的有根树)。集合合并的时间复杂度为O(1)。
-
集合合并之后,不是所有元素的Find(a)操作都是O(1)。
-
为了 “通过元素6来找新S1的句柄”的操作能够在O(1)的时间内完成,需要用到“路径压缩”:该路径上的所有元素都直接指向s1的首个元素。实施“路径压缩”优化之后,Find的平均时间复杂度仍是O(1)。
-
小结论:
Union的时间复杂度,是O(1).
Find的时间复杂度,通过“按秩合并”与“路径压缩”优化后,平均时间复杂度也是O(1).
三,有根树的代码实现
/**
*并查集
*/
class UnionFind {
int count;//连通分量个数
int[] parent;
int[] size;
public UnionFind(int n) {
this.count = n;
parent = new int[n];
size = new int[n];
for (int i = 0; i < n; i++) {
parent[i] = i;
size[i] = 1;
}
}
public int find(int x) {
if (parent[x] != x) {
parent[x] = find(parent[x]);
}
return parent[x];
}
public boolean union(int x, int y) {
int rootX = find(x);
int rootY = find(y);
if (rootX == rootY) {
return false;
}
// 小树接到大树下面,较平衡
if (size[rootX] > size[rootY]) {
parent[rootY] = rootX;
size[rootX] += size[rootY];
}else {
parent[rootX] = rootY;
size[rootY] += size[rootX];
}
count--;
return true;
}
}
四,链表实现
假设有以下两个集合:
S1={7,3,1,4}和S2={1,6}
-
集合里的每个元素,都指向s1,这样可以使得“查找元素a所在集合S”,即Find(a)操作在O(1)的时间内完成。
-
合并S1和S2两个集合
(1) 第一个集合的尾元素,链向第二个集合的头元素(蓝线1);
(2) 第二个集合的所有元素,指向第一个集合的句柄(蓝线2,3);
-
每个集合的平均元素个数是n,Union(X, Y)操作的时间复杂度是O(n).
四,参考
1.https://mp.weixin.qq.com/s/F2ro3zogfUHe5KMsLpjjiQ
2.https://mp.weixin.qq.com/s/gUwLfi25TYamq8AJVIopfA