并查集的思想

最新推荐文章于 2022-05-27 20:12:38 发布

jiangX1994

最新推荐文章于 2022-05-27 20:12:38 发布

阅读量1.5k

点赞数

分类专栏：并查集文章标签：算法

本文链接：https://blog.csdn.net/jiangX1994/article/details/37873729

版权

并查集是一种用于高效处理不相交集合合并与查找的算法。本文介绍了并查集的基本概念、树形结构与路径压缩，以及如何通过加权规则优化合并操作，确保操作效率。并查集在解决亲戚关系查询、嫌疑人识别等问题中有着广泛的应用。通过示例代码展示了如何在C++中实现并查集，并分析了使用并查集而非链表或数组的优势。

摘要由CSDN通过智能技术生成

并查集 (Union-Find Sets)
并查集：(union-find sets)是一种简单的用途广泛的集合. 并查集是若干个不相交集合，能够实现较快的合并和判断元素所在集合的操作，应用很多。一般采取树形结构来存储并查集，并利用一个rank数组来存储集合的深度下界，在查找操作时进行路径压缩使后续的查找操作加速。这样优化实现的并查集，空间复杂度为O(N)，建立一个集合的时间复杂度为O(1)，N次合并M查找的时间复杂度为O(M Alpha(N))，这里Alpha是Ackerman函数的某个反函数，在很大的范围内（人类目前观测到的宇宙范围估算有10的80次方个原子，这小于前面所说的范围）这个函数的值可以看成是不大于4的，所以并查集的操作可以看作是线性的。它支持以下三中种操作:
　　－Union (Root1, Root2) //并操作；把子集合Root2并入集合Root1中.要求：Root1和 Root2互不相交,否则不执行操作.
　　－Find (x) //搜索操作；搜索单元素x所在的集合,并返回该集合的名字.
　　－UFSets (s) //构造函数。将并查集中s个元素初始化为s个只有一个单元素的子集合.
　　－对于并查集来说，每个集合用一棵树表示。
　　－集合中每个元素的元素名分别存放在树的结点中，此外，树的每一个结点还有一个指向其双亲结点的指针。
　　－设 S1= {0, 6, 7, 8 }，S2= { 1, 4, 9 }，S3= { 2, 3, 5 }

－为简化讨论，忽略实际的集合名，仅用表示集合的树的根来标识集合。
　　－为此，采用树的双亲表示作为集合存储表示。集合元素的编号从0到 n-1。其中 n 是最大元素个数。在双亲表示中，第 i 个数组元素代表包含集合元素 i 的树结点。根结点的双亲为-1，表示集合中的元素个数。为了区别双亲指针信息( ≥ 0 )，集合元素个数信息用负数表示。

下标：
parent

集合S1, S2和S3的双亲表示:

S1 ∪ S2的可能的表示方法

const int DefaultSize = 10;
　　class UFSets { //并查集的类定义
　　private:
　　　int *parent;
　　　int size;
　　public:
　　　UFSets ( int s = DefaultSize );
　　　~UFSets ( ) { delete [ ] parent; }
　　　UFSets & operator = ( UFSets const & Value );//集合赋值
　　　void Union ( int Root1, int Root2 );
　　　int Find ( int x );
　　　void UnionByHeight ( int Root1, int Root2 ); };
　　　UFSets::UFSets ( int s ) { //构造函数
　　　size = s;
　　　parent = new int [size+1];
　　　for ( int i = 0; i <= size; i++ ) parent[i] = -1;
　　}

　　unsigned int UFSets::Find ( int x ) { //搜索操作
　　　if ( parent[x] <= 0 ) return x;
　　　else return Find ( parent[x] );
　　}

　　void UFSets::Union ( int Root1, int Root2 ) { //并
　　　parent[Root2] = Root1; //Root2指向Root1
　　}

Find和Union操作性能不好。假设最初 n 个元素构成 n 棵树组成的森林，parent[i] = -1。做处理Union(0, 1), Union(1, 2), …, Union(n-2, n-1)后，将产生如图所示的退化的树。

执行一次Union操作所需时间是O(1)，n-1次Union操作所需时间是O(n)。若再执行Find(0), Find(1), …, Find(n-1), 若被
搜索的元素为i，完成Find(i)操作需要时间为O(i)，完成 n 次搜索需要的总时间将达到
　　

Union操作的加权规则

　　为避免产生退化的树，改进方法是先判断两集合中元素的个数，如果以 i 为根的树中的结点个数少于以 j 为根的树中的结点个数，即parent[i] > parent[j]，则让 j 成为 i 的双亲，否则，让i成为j的双亲。此即Union的加权规则。

parent[0](== -4) < parent[4] (== -3)

void UFSets::WeightedUnion(int Root1, int Root2) {
　　　//按Union的加权规则改进的算法
　　　int temp = parent[Root1] + parent[Root2];
　　　if ( parent[Root2] < parent[Root1] ) {
　　　　parent[Root1] = Root2; //Root2中结点数多
　　　　parent[Root2] = temp; 　//Root1指向Root2
　　　}
　　　else {
　　　　parent[Root2] = Root1; //Root1中结点数多
　　　　parent[Root1] = temp; 　//Root2指向Root1
　　　}
　　}