一. 并查集基础
并查集可以处理
- 连接问题
- 数学中的集合类
连接问题
网络中节点间的连接状态
- 这里网络是个抽象概念: 用户之间形成的网络
二. Quick Find (实现第一版并查集)
对于一组数据, 并查集主演支持两个操作:
- union(p, q) p和q并入同一个集合
- find(p) p是属于哪个集合
用来回答一个问题
- isConnected(p, q) p和q是否是同一个集合即 p和q是否是连接的
举例
id 0 1 2 3 4 5 6 7 8 9
0 0 0 0 0 1 1 1 1 1
以上表示 0 1 2 3 4是互相连接的 5 6 7 8 9是互相连接的
代码 UnionFind.h
#ifndef INC_02_QUICK_FIND_UNIONFIND1_H
#define INC_02_QUICK_FIND_UNIONFIND1_H
#include <iostream>
#include <cassert>
using namespace std;
// 我们的第一版Union-Find
namespace UF1 {
class UnionFind {
private:
int *id; // 我们的第一版Union-Find本质就是一个数组
int count; // 数据个数
public:
// 构造函数
UnionFind(int n) {
count = n;
id = new int[n];
// 初始化, 每一个id[i]指向自己, 没有合并的元素
for (int i = 0; i < n; i++)
id[i] = i;
}
// 析构函数
~UnionFind() {
delete[] id;
}
// 查找过程, 查找元素p所对应的集合编号
int find(int p) {
assert(p >= 0 && p < count);
return id[p];
}
// 查看元素p和元素q是否所属一个集合
// O(1)复杂度
bool isConnected(int p, int q) {1
return find(p) == find(q);
}
// 合并元素p和元素q所属的集合
// O(n) 复杂度
void unionElements(int p, int q) {
int pID = find(p);
int qID = find(q);
if (pID == qID)
return;
// 合并过程需要遍历一遍所有元素, 将两个元素的所属集合编号合并
// 所有的同属pID的 都要改变
for (int i = 0; i < count; i++)
if (id[i] == pID)
id[i] = qID;
}
};
}
#endif //INC_02_QUICK_FIND_UNIONFIND1_H
三. Quick Union (改进并查集)
将每一个元素看成一个节点, 但不同的是它的指针指向其父节点
如下图所示, 所有元素连接在一起, 同属一个集合
这样会使 Union 非常快速
但在union操作时, 假设上面的树先恢复到未union的状态,得到
5 2
/ \ / \
6 7 3 1
现在要union 6 和 1, 步骤如下
- 6并非单一元素 1也并非单一元素,
- 找出6所在树的根结点5, 找出1所在树的根结点2
- 将其中一个指向另一个根节点即可 5->2
代码
UnionFind2.h
#ifndef INC_03_QUICK_UNION_UNIONFIND2_H
#define INC_03_QUICK_UNION_UNIONFIND2_H
#include <cassert>
using namespace std;
// 我们的第二版Union-Find
namespace UF2{
class UnionFind{
private:
// 我们的第二版Union-Find, 使用一个数组构建一棵指向父节点的树
// parent[i]表示第i个元素所指向的父节点
int* parent;
int count; // 数据个数
public:
// 构造函数
UnionFind(int count){
parent = new int[count];
this->count = count;
// 初始化, 每一个parent[i]指向自己, 表示每一个元素自己自成一个集合
for( int i = 0 ; i < count ; i ++ )
parent[i] = i;
}
// 析构函数
~UnionFind(){
delete[] parent;
}
// 查找过程, 查找元素p所对应的集合编号
// O(h)复杂度, h为树的高度
int find(int p){
assert( p >= 0 && p < count );
// 不断去查询自己的父亲节点, 直到到达根节点
// 根节点的特点: parent[p] == p
while( p != parent[p] )
p = parent[p];
return p;
}
// 查看元素p和元素q是否所属一个集合
// O(h)复杂度, h为树的高度
bool isConnected( int p , int q ){
return find(p) == find(q);
}
// 合并元素p和元素q所属的集合
// O(h)复杂度, h为树的高度
void unionElements(int p, int q){
int pRoot = find(p);
int qRoot = find(q);
if( pRoot == qRoot )
return;
parent[pRoot] = qRoot;
}
};
}
#endif //INC_03_QUICK_UNION_UNIONFIND2_H
四. 基于size的优化
UnionFind2实现的并查集存在的问题
现在有两棵树
9 8
|
3
|
4
union 9 和4, 很可能会得到
9
|
8
|
3
|
4
使得以后的find操作效率变低
优化思路
永远让节点少的树去指向节点多的树的根结点
代码实现
在UnionFind2.h 的基础上改进, 只需修改unionElements, 并增加一个sz表示每棵树的节点数
UnionFind3.h
#ifndef INC_04_OPTIMIZE_BY_SIZE_UNIONFIND3_H
#define INC_04_OPTIMIZE_BY_SIZE_UNIONFIND3_H
#include <cassert>
using namespace std;
// 我们的第三版Union-Find
namespace UF3{
class UnionFind{
private:
int* parent; // parent[i]表示第i个元素所指向的父节点
int* sz; // sz[i]表示以i为根的集合中元素个数
int count; // 数据个数
public:
// 构造函数
UnionFind(int count){
parent = new int[count];
sz = new int[count];
this->count = count;
for( int i = 0 ; i < count ; i ++ ){
parent[i] = i;
sz[i] = 1;
}
}
// 析构函数
~UnionFind(){
delete[] parent;
delete[] sz;
}
// 查找过程, 查找元素p所对应的集合编号
// O(h)复杂度, h为树的高度
int find(int p){
assert( p >= 0 && p < count );
// 不断去查询自己的父亲节点, 直到到达根节点
// 根节点的特点: parent[p] == p
while( p != parent[p] )
p = parent[p];
return p;
}
// 查看元素p和元素q是否所属一个集合
// O(h)复杂度, h为树的高度
bool isConnected( int p , int q ){
return find(p) == find(q);
}
// 合并元素p和元素q所属的集合
// O(h)复杂度, h为树的高度
void unionElements(int p, int q){
int pRoot = find(p);
int qRoot = find(q);
if( pRoot == qRoot )
return;
// 根据两个元素所在树的元素个数不同判断合并方向
// 将元素个数少的集合合并到元素个数多的集合上
if( sz[pRoot] < sz[qRoot] ){
parent[pRoot] = qRoot;
sz[qRoot] += sz[pRoot];
}
else{
parent[qRoot] = pRoot;
sz[pRoot] += sz[qRoot];
}
}
};
}
#endif //INC_04_OPTIMIZE_BY_SIZE_UNIONFIND3_H
五. 基于rank的优化
现在处理如下情况
如果按照UnionFind3.h 的 基于size的union, 会让8->7
但是显然没有 7->8 得到的结果好, 7->8得到的树层数会更低
基于rank的优化
-
rank[i]表示根节点为i的树的高度(层数)
代码实现
- 不用sz了, 改为使用rank[i]表示根节点为i的树的高度(层数)
- 修改unionElements函数
UnionFind4.h
#ifndef INC_05_OPTIMIZE_BY_RANK_UNIONFIND3_H
#define INC_05_OPTIMIZE_BY_RANK_UNIONFIND3_H
#include <cassert>
using namespace std;
// 我们的第四版Union-Find
namespace UF4{
class UnionFind{
private:
int* rank; // rank[i]表示以i为根的集合所表示的树的层数
int* parent; // parent[i]表示第i个元素所指向的父节点
int count; // 数据个数
public:
// 构造函数
UnionFind(int count){
parent = new int[count];
rank = new int[count];
this->count = count;
for( int i = 0 ; i < count ; i ++ ){
parent[i] = i;
rank[i] = 1;
}
}
// 析构函数
~UnionFind(){
delete[] parent;
delete[] rank;
}
// 查找过程, 查找元素p所对应的集合编号
// O(h)复杂度, h为树的高度
int find(int p){
...
}
// 查看元素p和元素q是否所属一个集合
// O(h)复杂度, h为树的高度
bool isConnected( int p , int q ){
return find(p) == find(q);
}
// 合并元素p和元素q所属的集合
// O(h)复杂度, h为树的高度
void unionElements(int p, int q){
int pRoot = find(p);
int qRoot = find(q);
if( pRoot == qRoot )
return;
// 根据两个元素所在树的元素个数不同判断合并方向
// 将元素个数少的集合合并到元素个数多的集合上
if( rank[pRoot] < rank[qRoot] ){
parent[pRoot] = qRoot;
}
else if( rank[qRoot] < rank[pRoot]){
parent[qRoot] = pRoot;
}
else{ // rank[pRoot] == rank[qRoot]
parent[pRoot] = qRoot;
rank[qRoot] += 1; // 此时, 我维护rank的值
}
}
};
}
#endif //INC_05_OPTIMIZE_BY_RANK_UNIONFIND3_H
六. 路径压缩(Path Compression)
之前的优化思路都在union中, 其实find也可以优化
0
|
1
|
2
|
3
|
4
- find(4)操作, 需要一步一步找到0. 我们可不可以在find的过程中优化 其所在的树结构呢?
- 让4指向其父节点3的父节点 4->2
- 让2指向它父节点1的父节点0 2->0
0
/ \
1 2
/ \
3 4
-
UnionFind5.h 只需要在UnionFind4.h基础上 在find函数中加入parent[p] = parent[parent[p]];
...
// 查找过程, 查找元素p所对应的集合编号
// O(h)复杂度, h为树的高度
int find(int p){
assert( p >= 0 && p < count );
// path compression 1
while( p != parent[p] ){
parent[p] = parent[parent[p]];
p = parent[p];
}
return p;
}
...
还有优化空间
----最优化---->
0 0
/ \ / | | \
1 2 1 2 3 4
/ \
3 4
- 代码依然只需修改find函数
// 查找过程, 查找元素p所对应的集合编号
// O(h)复杂度, h为树的高度
int find(int p){
assert( p >= 0 && p < count );
// path compression 1
//while( p != parent[p] ){
// parent[p] = parent[parent[p]];
// p = parent[p];
//}
//return p;
// path compression 2, 递归算法
if( p != parent[p] )
parent[p] = find( parent[p] ); //p的父节点, 指向其所在树的根
return parent[p];
}