不相交集合(Disjoint-Set)
不相交集合,顾名思义就是讲一些元素划分为不相交的几个集合。
其中每个集合都有一个”代表”作为该集合的标识符,如果这个集合可以表示成一棵树,那么集合的”代表”就是所有节点的公共祖先——树根。
实现不相交集合的最为常用的数据结构就是并查集。
并查集
并查集是典型的不相交集合的树形数据结构,提供了三种基本操作。
Make_Set(x):
建立一个新的集合,集合的唯一成员(代表)是x。因为是不相交集合,所以x不会出现在别的集合当中。Find_Root(x):
找到x所在集合的代表。如果x所在集合是一棵树,相当于寻找树的根。Union(x,y):
将x所在的集合和y所在的集合整合起来形成一个集合。假定在操作之前两个集合是不相交的。完成Union(x,y)操作后,一般规定小集合并入大集合。
给出三种操作的相应伪代码:
(摘自维基百科-并查集)
function Make_Set(x)
x.parent := x
function Find_Root(x)
if x.parent == x
return x
else
return Find(x.parent)
function Union(x, y)
xRoot := Find(x)
yRoot := Find(y)
xRoot.parent := yRoo
这是并查集森林的最基础的表示方法,然而这种方法并不好。不好的地方主要是在Find_Root()这个函数中。
最坏情况下,这个集合形成的是一棵倾斜树(即每一个节点都只有一个唯一后继),每次寻找都是O(n)的时间复杂度很慢。这样也会导致Union()操作很慢。
所以我们有两种常用的优化。
1. 按秩合并
即总是将更小的树连接至更大的树上。因为影响运行时间的是树的深度,更小的树添加到更深的树的根上将不会增加秩除非它们的秩相同。在这个算法中,术语“秩”替代了“深度”。
function MakeSet(x)
x.parent := x
x.rank := 0
function Union(x, y)
xRoot := Find(x)
yRoot := Find(y)
if xRoot == yRoot
return
// x和y不在同一个集合,合并它们。
if xRoot.rank < yRoot.rank
xRoot.parent := yRoot
else if xRoot.rank > yRoot.rank
yRoot.parent := xRoot
else
yRoot.parent := xRoot
xRoot.rank := xRoot.rank + 1
2. 路径压缩
路径压缩是一种在执行“查找”时扁平化树结构的方法。关键在于在路径上的每个节点都可以直接连接到根上;他们都有同样的表示方法。为了达到这样的效果,Find_Root递归地经过树,让每一个节点的父节点”指向”根节点。得到的树将更加扁平,为以后直接或者间接引用节点的操作加速。
function Find(x)
if x.parent != x
x.parent := Find(x.parent)
return x.parent