18_并查集优化

AI让世界更懂你

于 2024-09-11 01:53:52 发布

阅读量641

点赞数 7

分类专栏：漫谈数据结构【菜鸟与老鸟的对话】文章标签：数据结构

本文链接：https://blog.csdn.net/qq_35082030/article/details/142112893

版权

漫谈数据结构【菜鸟与老鸟的对话】专栏收录该内容

25 篇文章 0 订阅

订阅专栏

菜鸟：老鸟，我最近在处理一个涉及多个节点查询和合并的项目，感觉性能有些问题。现有的实现每次查询和合并操作都挺慢的，有什么高效的解决方案吗？

老鸟：听起来你遇到的是一个典型的并查集问题。用并查集优化可以显著提高这些操作的性能。你听说过并查集吗？

菜鸟：好像听说过，但不是很了解。你能详细讲讲吗？

老鸟：当然可以。我们慢慢来，从基本概念开始，然后逐步深入优化。

渐进式介绍概念

老鸟：并查集是一种树型数据结构，用于处理不相交集合的合并及查询问题。常用的操作是“查找（Find）”和“合并（Union）”。通过优化这些操作，我们可以将其复杂度降到近乎常数时间。

菜鸟：听起来很高效。具体怎么操作呢？

老鸟：我们先从基本的并查集结构开始，然后再讲如何优化。假设我们有一个数组 parent ，其中 parent[i] 表示元素 i 的父节点。初始时，每个元素都是它自己的父节点，即每个元素单独成一个集合。

class UnionFind:
    def __init__(self, n):
        self.parent = list(range(n))
    
    def find(self, x):
        if self.parent[x] != x:
            self.parent[x] = self.find(self.parent[x])
        return self.parent[x]
    
    def union(self, x, y):
        rootX = self.find(x)
        rootY = self.find(y)
        if rootX != rootY:
            self.parent[rootY] = rootX

菜鸟：上面的代码看起来比较简单，但为什么 find 方法要递归调用自己？

老鸟：这是路径压缩的一部分。递归调用 find 方法可以扁平化树的结构，使得后续的查找操作更快。我们来看一下具体的操作过程。

代码示例与分析

老鸟：我们一步步来看代码。首先是初始化：

uf = UnionFind(5)
print(uf.parent)  # [0, 1, 2, 3, 4]

菜鸟：每个元素都是它自己的父节点。

老鸟：对的。接下来，假设我们做一些合并操作：

uf.union(0, 1)
uf.union(1, 2)
print(uf.parent)  # [0, 0, 0, 3, 4]

菜鸟：为什么 parent[2] 最终指向 0？

老鸟：这就是路径压缩的结果。通过路径压缩，find 操作会使得树的高度减小，从而加速后续的查找操作。

菜鸟：明白了，那还有其他优化吗？

老鸟：有的，另一个重要的优化是按秩合并（Union by Rank）。我们通过维护一个 rank 数组来记录树的深度，总是将较小的树合并到较大的树上。

class UnionFind:
    def __init__(self, n):
        self.parent = list(range(n))
        self.rank = [0] * n
    
    def find(self, x):
        if self.parent[x] != x:
            self.parent[x] = self.find(self.parent[x])
        return self.parent[x]
    
    def union(self, x, y):
        rootX = self.find(x)
        rootY = self.find(y)
        if rootX != rootY:
            if self.rank[rootX] > self.rank[rootY]:
                self.parent[rootY] = rootX
            elif self.rank[rootX] < self.rank[rootY]:
                self.parent[rootX] = rootY
            else:
                self.parent[rootY] = rootX
                self.rank[rootX] += 1

菜鸟：按秩合并和路径压缩结合起来，查找和合并操作的复杂度都可以降低到接近常数时间。

问题与优化

菜鸟：如果我们的数据量非常大，有没有其他优化或者注意事项呢？

老鸟：对于非常大的数据集，按秩合并和路径压缩已经是相当高效的了。不过可以考虑并行化操作或其他特定场景下的优化，比如并行查询和批量合并。

适用场景与误区

老鸟：并查集优化主要适用于需要频繁合并和查找的场景，比如网络连接检测、图的连通性问题、动态连通性等。

菜鸟：有没有什么常见的误区需要注意？

老鸟：一个常见的误区是忽视路径压缩和按秩合并的重要性，导致性能问题。另外，要注意并查集适用于静态或动态合并和查询，不太适合频繁插入和删除的操作。

总结与延伸阅读

老鸟：总结一下，并查集通过路径压缩和按秩合并，可以将查找和合并操作的时间复杂度降到接近常数时间。适用于网络连接检测、图的连通性等频繁合并和查找的场景。

菜鸟：非常感谢，我学到了很多。有什么推荐的书籍或者文档可以进一步学习吗？

老鸟：你可以看看《算法导论》和《算法（第四版）》，这两本书都有详细的讲解。另外，LeetCode 上有很多相关的练习题，可以通过实战巩固知识。

菜鸟：太好了，感谢老鸟的指导！

老鸟：不客气，有问题随时来问！

AI让世界更懂你

关注

7
点赞
踩
13

收藏

觉得还不错? 一键收藏
打赏
0
评论
18_并查集优化

老鸟：并查集是一种树型数据结构，用于处理不相交集合的合并及查询问题。常用的操作是“查找（Find）”和“合并（Union）”。通过优化这些操作，我们可以将其复杂度降到近乎常数时间。菜鸟：听起来很高效。具体怎么操作呢？老鸟：我们先从基本的并查集结构开始，然后再讲如何优化。假设我们有一个数组parent，其中parent[i]表示元素i的父节点。初始时，每个元素都是它自己的父节点，即每个元素单独成一个集合。= rootY:菜鸟：上面的代码看起来比较简单，但为什么find。
复制链接

扫一扫