【树形结构】并查集 {并查集原理；并查集优化；并查集实现；并查集应用}

芥末虾

已于 2024-07-24 15:17:58 修改

阅读量520

点赞数 9

分类专栏：数据结构和算法 # 数据结构文章标签：数据结构并查集图算法

于 2024-05-07 09:56:09 首次发布

本文链接：https://blog.csdn.net/zty857016148/article/details/138519906

版权

数据结构和算法同时被 2 个专栏收录

53 篇文章 1 订阅

订阅专栏

数据结构

21 篇文章 0 订阅

订阅专栏

一、并查集原理

在一些应用问题中，需要将n个不同的元素划分成一些不相交的集合。开始时，每个元素自成一个单元素集合，然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集(union-findset)。

比如：某公司今年校招全国总共招生10人，西安招4人，成都招3人，武汉招3人，10个人来自不同的学校，起先互不相识，每个学生都是一个独立的小团体，现给这些学生进行编号：{0, 1, 2, 3,4, 5, 6, 7, 8, 9}; 给以下数组用来存储该小集体，数组中的数字代表：该小集体中具有成员的个数。(负号下文解释)

在这里插入图片描述

毕业后，学生们要去公司上班，每个地方的学生自发组织成小分队一起上路，于是：西安学生小分队s1={0,6,7,8}，成都学生小分队s2={1,4,9}，武汉学生小分队s3={2,3,5}就相互认识了，10个人形成了三个小团体。假设右三个群主0,1,2担任队长，负责大家的出行。

在这里插入图片描述

一趟火车之旅后，每个小分队成员就互相熟悉，称为了一个朋友圈。

在这里插入图片描述

从上图可以看出：编号6,7,8同学属于0号小分队，该小分队中有4人(包含队长0)；编号为4和9的同学属于1号小分队，该小分队有3人(包含队长1)，编号为3和5的同学属于2号小分队，该小分队有3个人(包含队长1)。

仔细观察数组中的内容，可以得出以下结论：

数组的下标对应集合中元素的编号
数组中如果为负数，负号代表根，数字代表该集合中元素个数
数组中如果为非负数，代表该元素双亲在数组中的下标

在公司工作一段时间后，西安小分队中8号同学与成都小分队1号同学奇迹般的走到了一起，两个小圈子的学生相互介绍，最后成为了一个小圈子：

在这里插入图片描述

现在0集合有7个人，2集合有3个人，总共两个朋友圈。
通过以上例子可知，并查集一般可以解决一下问题：

查找元素属于哪个集合
沿着数组表示的树形关系向上一直找到根 (即：树中中元素为负数的位置)
查看两个元素是否属于同一个集合
沿着数组表示的树形关系往上一直找到树的根，如果根相同表明在同一个集合，否则不在
将两个集合归并成一个集合
找到两个集合的根
一个根任作为根，另一个作孩子：作根的将两集合的元素个数加到一起，作孩子的，将值变为根在数组中的下标
集合的个数
遍历数组，数组中元素为负数的个数即为集合的个数。

二、并查集优化

按秩合并
按秩合并是并查集的一种优化方法，其核心思想是在合并两个集合时，将秩（可以理解为树的高度）较小的节点的根直接接到秩较大的节点的根上，而不必在寻找秩较大的节点的根的过程中进行额外的find函数调用。这样做的好处是可以减少find函数的调用次数，从而优化算法的效率。
我们用一个数组rank[]记录每个根节点对应的树的深度（如果不是根节点，其rank相当于以它作为根节点的子树的深度）。一开始，把所有元素的rank（秩）设为1。合并时比较两个根节点，把rank较小者往较大者上合并。具体来说，如果两个集合的秩不同，那么秩较小的集合的根节点会成为秩较大的集合的子节点。如果两个集合的秩相同，那么在合并时，秩较大的集合的根节点的秩会增加1。
按秩合并的好处包括：
降低树的高度：按秩合并优化了合并操作，使得树的高度相对较小，从而减少了查找操作的时间复杂度。
提高查找操作效率：通过按秩合并，将较小的树合并到较大的树上，减少树的高度，从而减少了查找操作的路径长度，提高了查找效率。
平衡树的结构：按秩合并能够保持树结构的平衡性，避免树退化成链表，进一步提高了查找操作的效率。
路径压缩
然而，需要注意的是，按秩合并虽然在一定程度上优化了并查集的性能，但在实际应用中，路径压缩技术往往能带来更大的性能提升。路径压缩是一种在查找节点根节点的同时，将查找路径上的节点的父节点直接设置为根节点的方法，这样可以使得树的深度大大降低，从而在后续的操作中提高效率。
路径压缩和按秩合并如果一起使用，很可能会破坏rank的准确性。
算法学习笔记：并查集的优化详解

二、并查集实现

#include <vector>
#include <map>
using namespace std;

// 只有编号，实现一个简单的并查集
class UnionFindSet{
    vector<int> _ufs; //并查集s

public:
    UnionFindSet(int n)
    {
        _ufs.resize(n, -1); //初始时，每个元素自成一个单元素集合
    }

    bool Union(int x, int y)
    {
        int rx = FindRoot(x);
        int ry = FindRoot(y);
        if(rx == ry) return false;
        _ufs[rx] += _ufs[ry];
        _ufs[ry] = rx;
        return true;
    }

    int FindRoot(int x)
    {
        int root = x;
        while(_ufs[root] >= 0)
        {
            root = _ufs[root];
        }

        // 路径压缩
        while(_ufs[x] >= 0)
        {
            int parent = _ufs[x];
            _ufs[x] = root;
            x = parent;
        }
        
        return root;
    }

    bool InSet(int x, int y)
    {
        return FindRoot(x)==FindRoot(y);
    }

    int SetCount()
    {
        int count = 0;
        for(int e : _ufs)
        {
            if(e < 0) ++count;
        }
        return count;
    }
};

// 其他数据类型组成的并查集
// 1.建立编号和其他数据类型相互的映射关系
// 2.最终还是要通过编号组织并查集
// template <class T>
// class UnionFindSet{
//     vector<T> _vct; //编号找人
//     map<T, int> _map; //人找编号
//     vector<int> _ufs; //并查集s
// public:
//     UnionFindSet(const T* set, int n)
//     {
//         //1.建立编号<-->人名的映射关系
//         for(int i = 0; i < n; ++i)
//         {
//             _vct.push_back(set[i]);
//             _map[set[i]] = i;
//         }
//         //2.初始化并查集
//         _ufs.resize(n, -1); //初始时，每个元素自成一个单元素集合
//     }
// };

三、并查集应用

LCR 116. 省份数量 - 力扣（LeetCode）

class Solution {
public:
    int findCircleNum(vector<vector<int>>& isConnected) {
        vector<int> ufs(isConnected.size(), -1);
        auto FindRoot = [&ufs](int x)
        {
            while(ufs[x] >= 0) x = ufs[x];
            return x;
        };
        
        for(int i = 0; i < isConnected.size(); ++i)
        {
            for(int j = 0; j < isConnected[i].size(); ++j)
            {
                if(isConnected[i][j] == 1) 
                {
                    int r1 = FindRoot(i);
                    int r2 = FindRoot(j);
                    if(r1 != r2)
                    {
                        ufs[r1] += ufs[r2];
                        ufs[r2] = r1;
                    }
                }
            }
        }

        int count = 0;
        for(int e : ufs)
        {
            if(e < 0) ++count;
        }
        return count;
    }
};

990. 等式方程的可满足性 - 力扣（LeetCode）

class Solution {
public:
    bool equationsPossible(vector<string>& equations) {
         vector<int> ufs(26, -1);
         auto FindRoot = [&ufs](int x)
         {
            while(ufs[x] >= 0) x = ufs[x];
            return x;
         };

         for(auto& e : equations)
         {
            if(e[1] == '=')
            {
                int r1 = FindRoot(e[0]-'a');
                int r2 = FindRoot(e[3]-'a');
                if(r1 != r2)
                {
                    ufs[r1] += ufs[r2];
                    ufs[r2] = r1;
                }
            }
         }

         for(auto& e : equations)
         {
            if(e[1] == '!')
            {
                int r1 = FindRoot(e[0]-'a');
                int r2 = FindRoot(e[3]-'a');
                if(r1 == r2) 
                    return false;
            }
         }
         return true;
    }
};