在这一章,描述解决等价问题的一种有效数据结构。
8.1 等价关系
等价关系满足下列三个性质的关系R:
(1) 自反性:对于所有的a∈S,a R a;
(2) 对称性:a R b当且仅当b R a;
(3)传递性:若a R b且 b R c则 a R c。
例如,≤就不是等价关系,能满足自反性和传递性,却不能满足对称。
8.2 动态等价性问题
- 元素a∈S的等价类是S的子集,它包含所有与a有等价关系的元素。
- 如果Si∩Sj=空集,这就说明这些集合不相交。
- 建立一个新集合Sk = Si ∪Sj,去掉两个集合而保持所有的集合的不相交性,由于这个原因,把这项工作的算法叫做不相交集合的求并/查找。
- 解决动态等价问题的方案有两种:
- 保证指令find能够以常数最坏情形运行时间执行
- 另一种方案保证指令union能够以常数最坏情形运行时间执行。
8.3 基本数据结构
一种想法是使用树来表示每一个集合,因为树上的每一个元素都有相同的根。需要的唯一信息就是父链。
执行两个集合的union操作,通过使一棵树的根的父链链接到另一棵树的根结点合并两棵树。
实现代码如下。
//不相交集的类架构
class DisjSects
{
public:
explicit DisjSets(int numElements);
int find(int x)const;
int find(int x);
void unionSets(int root1,int root2);
private:
vector<int> s;
}
//初始化
DisjSets::DisjSets(int numElements):s(numElements)
{
for(int i =0; i<s.size(); i++)
s[i] = -1;
}
//不是最好的方法
void DisjSets::unionSets(int root1, int root2)
{
s[root2] = root1;
}
//一个简单的不相交集find算法
int DisjSets::find(int x)const
{
if(s[x] < 0)
return x;
else
return find(s[x]);
}
8.4 灵巧求并算法
8.3中介绍的执行很随意,使第二棵树成为第一棵树的子树而完成合并。简单改进是借助任意的方法打破现有的随意性。让总是较小的树称为较大的树的子树,这种方法叫做按大小求并。
结点的深度不会超过logN。
为了实现,我们需要记住每一棵树的大小,使用一个数组,就可以让每个根的数组元素包含它的树的大小的负值。
另外一种方法是按高度求并,也能保证深度最多是logN。只有当两棵树相等深度求并时树的高度才增加。
实现代码如下
void DisjSets::unionSets(int root1,int root2)
{
if(s[root2] < s[root1])
s[root1] = root2;
else
{
if(s[root2] == s[root1])
s[root1] --;
s[root2] = root1;
}
}
8.5 路径压缩
对find操作进行改进,叫做路径压缩。效果为从x到根的路径上的每一个结点都使它的父节点变成根。
改进代码如下:
int DisjSets::find(int x)
{
if(s[x] < 0)
return x;
else
return s[x] = find(s[x]);
}