并查集
相关概念
1. 不相交集
将编号分别为1…N的N个对象划分为不相交集合,在每个集合中选择其中某个元素代表所在集合。
2. 并查集
并查集是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。有一个联合-查找算法(union-find algorithm)定义了两个用于此数据结构的操作:
- Make_Set(x) 把每一个元素初始化为一个集合。
- Find(x):确定元素x属于哪一个子集。它可以被用来确定两个元素是否属于同一子集。
- Union(a,b):将a,b两个元素所在的子集合并成同一个集合。
由于支持这两种操作,一个不相交集也常被称为联合-查找数据结构(union-find data structure)或合并-查找集合(merge-find set)。其他的重要方法,MakeSet,用于建立单元素集合。有了这些方法,许多经典的划分问题可以被解决。
3. 相关操作
Make_Set(x)
初始化后每一个元素的父亲节点是它本身,每一个元素的祖先节点也是它本身,也可以根据具体情况来进行决定,比如有同学提到使用memset对所有元素的初始值赋值为非法值-1,对数据集较大时相对于循环赋值有一定的优化。
Find(x)
查找一个元素所在的集合,其精髓是找到这个元素所在集合的祖先,该功能有find完成。判断两个元素是否属于同一集合,只要看他们所在集合的祖先是否相同即可。