本文地址:http://blog.csdn.net/spch2008/article/details/9338943
基本介绍
一个集合S,集合中一个元素a。a的等价类是S的一个子集,该子集包含所有与a有关系的元素。
等价类形成是对S的一个划分且S中的每一个成员恰好出现在一个等价类中。这样,判断a与b是否有关系,
只需要判断a与b是否在一个等价类中即可。
对于集合S划分,取任意两个等价类,Si与Sj,如果Si∩Sj = ∅,则称这些集合不相交。
对于不相交集,有两种操作,Union/Find操作。Find操作找包含给定元素的集合(等价类)名字。
Union把两个等价类合并成一个新的等价类。
数据结构:采用树来表示每一个集合(等价类),因为树上的元素都有一个共同的根。
Union(X, Y),将X,Y合并成一个新的等价类,且X做为根。
Union(5,6)
Union(7,8)
Union(5,7)
这样的构造方法,最坏情况下可以构建一课高度为N-1的树,即Union(7,8), Union(6,7), Union(5,6)……
这使得Find操作在N-1次操作下才能找到树根,运行时间O(N)
将上述森林用数组表示,约定数组1-8个元素对应的值代表其父亲,例如元素8对应的值为7,表示其父亲为7。
而5对应的值为0,表示5本身就是树根。
这样找树根就是一个递归过程,如:Find(8), 父亲为7, 执行Find(7),父亲为5,执行Find(5),对应值为0,表示5为树根,递归结束,
这样即找到8所在等价类的树根为5。判断6,8是否有关系,即Find(8) == Find(6)是否成立。
typedef int SetType;
typedef int ElementType;
typedef int* DisjSet;
DisjSet Initialize(int Num)
{
DisjSet S = new SetType[Num + 1];
for(int i = 0; i < Num + 1; i++)
S[i] = 0;
return S;
}
void Destroy(DisjSet S)
{
delete [] S;
}
void Union(DisjSet S, SetType root1, SetType root2)
{
S[root2] = root1;
}
SetType Find(DisjSet S, ElementType X)
{
if(S[X] <= 0)
return X;
else
return Find(S, S[X]);
}
int main()
{
int elementNum = 8;
DisjSet S = Initialize(elementNum);
Union(S, 5, 6);
Union(S, 7, 8);
Union(S, 5, 7);
cout << ( Find(S, 4) == Find(S, 5) )<< endl;
cout << ( Find(S, 6) == Find(S, 8) )<< endl;
Destroy(S);
system("pause");
return 0;
}
优化Union
为了避免树的深度过大,可以每次让深度大的树做为新根,这样减少树深度增加速率。
那么就需要记住当前根的深度,而由于我们只采用了一个数组,所以,可以让根的值为负值,代表深度。
这样,根节点的值为-1,表示深度为-1。
对于上述情形,执行Union(4,5)。按照之前的Union操作,得到结果为:优化后结果
对应优化后结果的数组如下:
void Union(DisjSet S, SetType root1, SetType root2)
{
if(S[root2] < S[root1])
S[root1] = root2;
else
{
if(S[root1] == S[root2])
S[root1]--;
S[root2] = root1;
}
}
路径压缩
对于比较深的树,Find操作还是比较耗时的,要一步一步递归直至树根。
改进思路:执行一次Find后,让该路径上,所有节点直接指向根,而不需要指向父亲,这样下一次查找的时候能够快速找到根,节约时间。
执行一次Find(8)操作。由于元素8所在树的树根为5,所以执行Find后,数组要变成。
这样,当进行下一次调用Find(8)的时候,能够快速找到8对应的树根。
SetType Find(DisjSet S, ElementType X)
{
if(S[X] <= 0)
return X;
else
return S[X] = Find(S, S[X]);
}