5. 并查集

最新推荐文章于 2023-01-16 07:00:00 发布

书山压力大EEE

最新推荐文章于 2023-01-16 07:00:00 发布

阅读量114

点赞数 1

分类专栏：基础算法

本文链接：https://blog.csdn.net/weixin_41207499/article/details/83960099

版权

基础算法专栏收录该内容

8 篇文章 0 订阅

订阅专栏

一. 并查集基础

并查集可以处理

连接问题
数学中的集合类

连接问题

网络中节点间的连接状态

这里网络是个抽象概念：用户之间形成的网络

二. Quick Find (实现第一版并查集)

对于一组数据，并查集主演支持两个操作：

union(p, q) p和q并入同一个集合
find(p) p是属于哪个集合

用来回答一个问题

isConnected(p, q) p和q是否是同一个集合即 p和q是否是连接的

举例

id  0 1 2 3 4 5 6 7 8 9

    0 0 0 0 0 1 1 1 1 1


以上表示  0 1 2 3 4是互相连接的    5 6 7 8 9是互相连接的

代码 UnionFind.h

#ifndef INC_02_QUICK_FIND_UNIONFIND1_H
#define INC_02_QUICK_FIND_UNIONFIND1_H

#include <iostream>
#include <cassert>

using namespace std;

// 我们的第一版Union-Find
namespace UF1 {

    class UnionFind {

    private:
        int *id;    // 我们的第一版Union-Find本质就是一个数组
        int count;  // 数据个数

    public:
        // 构造函数
        UnionFind(int n) {
            count = n;
            id = new int[n];
            // 初始化, 每一个id[i]指向自己, 没有合并的元素
            for (int i = 0; i < n; i++)
                id[i] = i;
        }

        // 析构函数
        ~UnionFind() {
            delete[] id;
        }

        // 查找过程, 查找元素p所对应的集合编号
        int find(int p) {
            assert(p >= 0 && p < count);
            return id[p];
        }

        // 查看元素p和元素q是否所属一个集合
        // O(1)复杂度
        bool isConnected(int p, int q) {1
            return find(p) == find(q);
        }

        // 合并元素p和元素q所属的集合
        // O(n) 复杂度
        void unionElements(int p, int q) {

            int pID = find(p);
            int qID = find(q);

            if (pID == qID)
                return;

            // 合并过程需要遍历一遍所有元素, 将两个元素的所属集合编号合并
            // 所有的同属pID的  都要改变
            for (int i = 0; i < count; i++)
                if (id[i] == pID)
                    id[i] = qID;
        }
    };
}
#endif //INC_02_QUICK_FIND_UNIONFIND1_H

三. Quick Union (改进并查集)

将每一个元素看成一个节点，但不同的是它的指针指向其父节点

如下图所示，所有元素连接在一起，同属一个集合

这样会使 Union 非常快速

但在union操作时, 假设上面的树先恢复到未union的状态,得到

   5               2   
 /   \           /   \
6     7         3     1

现在要union 6 和 1，步骤如下

6并非单一元素 1也并非单一元素，
找出6所在树的根结点5，找出1所在树的根结点2
将其中一个指向另一个根节点即可 5->2

代码

UnionFind2.h

#ifndef INC_03_QUICK_UNION_UNIONFIND2_H
#define INC_03_QUICK_UNION_UNIONFIND2_H

#include <cassert>

using namespace std;

// 我们的第二版Union-Find
namespace UF2{

    class UnionFind{

    private:
        // 我们的第二版Union-Find, 使用一个数组构建一棵指向父节点的树
        // parent[i]表示第i个元素所指向的父节点
        int* parent;
        int count;  // 数据个数

    public:
        // 构造函数
        UnionFind(int count){
            parent = new int[count];
            this->count = count;
            // 初始化, 每一个parent[i]指向自己, 表示每一个元素自己自成一个集合
            for( int i = 0 ; i < count ; i ++ )
                parent[i] = i;
        }

        // 析构函数
        ~UnionFind(){
            delete[] parent;
        }

        // 查找过程, 查找元素p所对应的集合编号
        // O(h)复杂度, h为树的高度
        int find(int p){
            assert( p >= 0 && p < count );
            // 不断去查询自己的父亲节点, 直到到达根节点
            // 根节点的特点: parent[p] == p
            while( p != parent[p] )
                p = parent[p];
            return p;
        }

        // 查看元素p和元素q是否所属一个集合
        // O(h)复杂度, h为树的高度
        bool isConnected( int p , int q ){
            return find(p) == find(q);
        }

        // 合并元素p和元素q所属的集合
        // O(h)复杂度, h为树的高度
        void unionElements(int p, int q){

            int pRoot = find(p);
            int qRoot = find(q);

            if( pRoot == qRoot )
                return;

            parent[pRoot] = qRoot;
        }
    };
}

#endif //INC_03_QUICK_UNION_UNIONFIND2_H

四. 基于size的优化

UnionFind2实现的并查集存在的问题

现在有两棵树

union 9 和4，很可能会得到

9
|
8
|
3
|
4

使得以后的find操作效率变低

优化思路

永远让节点少的树去指向节点多的树的根结点

代码实现

在UnionFind2.h 的基础上改进，只需修改unionElements, 并增加一个sz表示每棵树的节点数

UnionFind3.h

#ifndef INC_04_OPTIMIZE_BY_SIZE_UNIONFIND3_H
#define INC_04_OPTIMIZE_BY_SIZE_UNIONFIND3_H

#include <cassert>

using namespace std;

// 我们的第三版Union-Find
namespace UF3{

    class UnionFind{

    private:
        int* parent; // parent[i]表示第i个元素所指向的父节点
        int* sz;     // sz[i]表示以i为根的集合中元素个数
        int count;   // 数据个数

    public:
        // 构造函数
        UnionFind(int count){
            parent = new int[count];
            sz = new int[count];
            this->count = count;
            for( int i = 0 ; i < count ; i ++ ){
                parent[i] = i;
                sz[i] = 1;
            }
        }

        // 析构函数
        ~UnionFind(){
            delete[] parent;
            delete[] sz;
        }

        // 查找过程, 查找元素p所对应的集合编号
        // O(h)复杂度, h为树的高度
        int find(int p){
            assert( p >= 0 && p < count );
            // 不断去查询自己的父亲节点, 直到到达根节点
            // 根节点的特点: parent[p] == p
            while( p != parent[p] )
                p = parent[p];
            return p;
        }

        // 查看元素p和元素q是否所属一个集合
        // O(h)复杂度, h为树的高度
        bool isConnected( int p , int q ){
            return find(p) == find(q);
        }

        // 合并元素p和元素q所属的集合
        // O(h)复杂度, h为树的高度
        void unionElements(int p, int q){

            int pRoot = find(p);
            int qRoot = find(q);

            if( pRoot == qRoot )
                return;

            // 根据两个元素所在树的元素个数不同判断合并方向
            // 将元素个数少的集合合并到元素个数多的集合上
            if( sz[pRoot] < sz[qRoot] ){
                parent[pRoot] = qRoot;
                sz[qRoot] += sz[pRoot];
            }
            else{
                parent[qRoot] = pRoot;
                sz[pRoot] += sz[qRoot];
            }
        }
    };
}

#endif //INC_04_OPTIMIZE_BY_SIZE_UNIONFIND3_H

五. 基于rank的优化

现在处理如下情况

如果按照UnionFind3.h 的基于size的union，会让8->7

但是显然没有 7->8 得到的结果好， 7->8得到的树层数会更低

基于rank的优化

rank[i]表示根节点为i的树的高度(层数)

代码实现

不用sz了，改为使用rank[i]表示根节点为i的树的高度(层数)
修改unionElements函数

UnionFind4.h


#ifndef INC_05_OPTIMIZE_BY_RANK_UNIONFIND3_H
#define INC_05_OPTIMIZE_BY_RANK_UNIONFIND3_H

#include <cassert>

using namespace std;

// 我们的第四版Union-Find
namespace UF4{

    class UnionFind{

    private:
        int* rank;   // rank[i]表示以i为根的集合所表示的树的层数
        int* parent; // parent[i]表示第i个元素所指向的父节点
        int count;   // 数据个数

    public:
        // 构造函数
        UnionFind(int count){
            parent = new int[count];
            rank = new int[count];
            this->count = count;
            for( int i = 0 ; i < count ; i ++ ){
                parent[i] = i;
                rank[i] = 1;
            }
        }

        // 析构函数
        ~UnionFind(){
            delete[] parent;
            delete[] rank;
        }

        // 查找过程, 查找元素p所对应的集合编号
        // O(h)复杂度, h为树的高度
        int find(int p){
          ...
        }

        // 查看元素p和元素q是否所属一个集合
        // O(h)复杂度, h为树的高度
        bool isConnected( int p , int q ){
            return find(p) == find(q);
        }

        // 合并元素p和元素q所属的集合
        // O(h)复杂度, h为树的高度
        void unionElements(int p, int q){

            int pRoot = find(p);
            int qRoot = find(q);

            if( pRoot == qRoot )
                return;

            // 根据两个元素所在树的元素个数不同判断合并方向
            // 将元素个数少的集合合并到元素个数多的集合上
            if( rank[pRoot] < rank[qRoot] ){
                parent[pRoot] = qRoot;
            }
            else if( rank[qRoot] < rank[pRoot]){
                parent[qRoot] = pRoot;
            }
            else{ // rank[pRoot] == rank[qRoot]
                parent[pRoot] = qRoot;
                rank[qRoot] += 1;   // 此时, 我维护rank的值
            }
        }
    };
}

#endif //INC_05_OPTIMIZE_BY_RANK_UNIONFIND3_H

六. 路径压缩(Path Compression)

之前的优化思路都在union中，其实find也可以优化

0
|
1
|
2
|
3
|
4

find(4)操作，需要一步一步找到0. 我们可不可以在find的过程中优化其所在的树结构呢？
让4指向其父节点3的父节点 4->2
让2指向它父节点1的父节点0 2->0

UnionFind5.h 只需要在UnionFind4.h基础上在find函数中加入parent[p] = parent[parent[p]];

...
        // 查找过程, 查找元素p所对应的集合编号
        // O(h)复杂度, h为树的高度
        int find(int p){
            assert( p >= 0 && p < count );

            // path compression 1
            while( p != parent[p] ){
                parent[p] = parent[parent[p]];
                p = parent[p];
            }
            return p;

        }
...

还有优化空间

                        ----最优化---->
          0                                      0
         / \                                  / | | \            
        1   2                                1  2 3  4
           / \
          3   4

代码依然只需修改find函数

        // 查找过程, 查找元素p所对应的集合编号
        // O(h)复杂度, h为树的高度
        int find(int p){
            assert( p >= 0 && p < count );

            // path compression 1
            //while( p != parent[p] ){
            //    parent[p] = parent[parent[p]];
            //    p = parent[p];
            //}
            //return p;

            // path compression 2, 递归算法
            if( p != parent[p] )
                parent[p] = find( parent[p] );  //p的父节点， 指向其所在树的根
            return parent[p];
        }

路径压缩以后的并查集，时间复杂度近乎是O(1)的

书山压力大EEE

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
5. 并查集

一. 并查集基础并查集可以处理连接问题数学中的集合类连接问题网络中节点间的连接状态这里网络是个抽象概念：用户之间形成的网络二. Quick Find (实现第一版并查集)对于一组数据，并查集主演支持两个操作：union(p, q) p和q并入同一个集合 find(p) p是属于哪个集合用来回答一个问题isConnected(p, q) p和q是否是同一个...
复制链接

扫一扫