并查集分析与模板C++

最新推荐文章于 2021-10-21 16:11:58 发布

Alvin畅

最新推荐文章于 2021-10-21 16:11:58 发布

阅读量134

点赞数

原文链接：https://leetcode-cn.com/problems/number-of-provinces/solution/python-duo-tu-xiang-jie-bing-cha-ji-by-m-vjdr/

版权

并查集是一种数据结构
并（Union），代表合并
查（Find），代表查找
集（Set），代表这是一个以字典为基础的数据结构，它的基本功能是合并集合中的元素，查找集合中的元素
并查集的典型应用是有关连通分量的问题
并查集解决单个问题（添加，合并，查找）的时间复杂度都是O(1)O(1)O(1)
因此，并查集可以应用到在线算法中

并查集跟树有些类似，只不过她跟树是相反的。在树这个数据结构里面，每个节点会记录它的子节点。在并查集里，每个节点会记录它的父节点。

class UnionFind{
private:
    // 记录父节点
    unordered_map<int,int> father;
};

当把一个新节点添加到并查集中，它的父节点应该为空

    void add(int x){
        if(!father.count(x)){
            father[x] = -1;
        }
    }

如果发现两个节点是连通的，那么就要把他们合并，也就是他们的祖先是相同的。这里究竟把谁当做父节点一般是没有区别的。

    void merge(int x,int y){
        int root_x = find(x);
        int root_y = find(y);
        
        if(root_x != root_y){
            father[root_x] = root_y;
        }
    }

我们判断两个节点是否处于同一个连通分量的时候，就需要判断它们的祖先是否相同

    bool is_connected(int x,int y){
        return find(x) == find(y);
    }

查找祖先的方法是：如果节点的父节点不为空，那就不断迭代

    int find(int x){
        int root = x;
        
        while(father[root] != -1){
            root = father[root];
        }
        
        return root;
    }

这里有一个优化的点：如果我们树很深，比如说退化成链表，那么每次查询的效率都会非常低。所以我们要做一下路径压缩。也就是把树的深度固定为二。
这么做可行的原因是，并查集只是记录了节点之间的连通关系，而节点相互连通只需要有一个相同的祖先就可以了。
路径压缩可以用递归，也可以迭代。这里用迭代的方法。

    int find(int x){
        int root = x;
        
        while(father[root] != -1){
            root = father[root];
        }
        
        // 路径压缩
        while(x != root){
            int original_father = father[x];
            father[x] = root;
            x = original_father;
        }
        
        return root;
    }

完整模板

class UnionFind{
public:
    int find(int x){
        int root = x;
        
        while(father[root] != -1){
            root = father[root];
        }
        
        while(x != root){
            int original_father = father[x];
            father[x] = root;
            x = original_father;
        }
        
        return root;
    }
    
    bool is_connected(int x,int y){
        return find(x) == find(y);
    }
    
    void merge(int x,int y){
        int root_x = find(x);
        int root_y = find(y);
        
        if(root_x != root_y){
            father[root_x] = root_y;
        }
    }
    
    void add(int x){
        if(!father.count(x)){
            father[x] = -1;
        }
    }
    
private:
    // 记录父节点
    unordered_map<int,int> father;
};

并查集一般有两种优化，这里规范一下表达：

「路径压缩」：在并查集中查找代表元素时，会将经过的所有元素「直接」连接到代表元素，也就是将连通分量「压扁」。

「按秩合并」：在并查集中合并两个连通分量时，将「秩」小的连通分量合并到「秩」大的连通分量上面。这里「秩」可以定义为连通分量的大小（包含的节点数量），或者连通分量的高度（连通分量是树的结构，因此可以定义高度。不过在「路径压缩」优化的基础上，这个高度会不断减小，但我们不用去时刻维护它，这样也可以达到最优的时间复杂度是已经被证明的了）。

当并查集中的元素个数为 n 时，下面的表格给出了单次并查集操作的时间复杂度

Alvin畅

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
并查集分析与模板C++

并查集是一种数据结构并（Union），代表合并查（Find），代表查找集（Set），代表这是一个以字典为基础的数据结构，它的基本功能是合并集合中的元素，查找集合中的元素并查集的典型应用是有关连通分量的问题并查集解决单个问题（添加，合并，查找）的时间复杂度都是O(1)O(1)O(1)因此，并查集可以应用到在线算法中并查集跟树有些类似，只不过她跟树是相反的。在树这个数据结构里面，每个节点会记录它的子节点。在并查集里，每个节点会记录它的父节点。class UnionFind{priva.
复制链接

扫一扫