不相交集_settype find ( elementtype x, disjset s )-CSDN博客

本文链接：https://blog.csdn.net/kdb_viewer/article/details/83011406

不相交集用来解决等价问题，特点是编程实现很简单但是分析复杂。

关系：对于每一对元素 $(a,b),a,b\in S$ ， aRb 或者为true或者为false，称在集合S上定义关系R。若aRb是true，那么a和b有关系

等价关系：是满足以下3个性质的关系R：

1.自反性，对所有 $a\in S$ ，aRa

2.对称性，aRb当且仅当bRa

3.传递性，若aRb，bRc，那么aRc

一个例子： $\leqslant$ 不是等价关系，满足自反性和传递性，但是不满足对称性

用来解决等价问题的数据结构：

1.使用二维数组，缺点是浪费大量空间，比如若定义~是等价关系，那么a~b，b~c，c~d就足够判断abcd4个元素是相互等价的，但是二维布尔数组来表示这个问题很不明显

2.使用等价类，一个元素 $a\in S$ 的等价类是S的一个子集，包含所有和a有关系的元素，注意，每个元素只能出现在一个等价类中，否则按照传递性，两个等价类将合并。这样，为了验证a~b，只要验证a和b是否在一个等价类中。等价类的数据结构描述：初始输入是N个集合的类，每个集合中只有一个元素，集合之间不相交，允许使用两种运算：

Find：返回给定元素的集合的名字

Union：将a和b所在的两个等价类合并成一个新的等价类

称为不相交集的find/union运算，这是一个联机算法，执行过程中，集合通过union改变

方案：解决动态等价问题有两种方案，一种保证find常数时间，一种保证union常数时间，这两者不能同时做到。

代码如下：

#include <stdio.h>

#define NumSets   128

typedef int DisjSet[NumSets + 1];
typedef int SetType;
typedef int ElementType;

void Initialize(DisjSet S);
void SetUnion(DisjSet S, SetType Root1, SetType Root2);
SetType Find(ElementType X, DisjSet S);

/* 隐式的树，值为0表示自己是根，初始的时候，每个元素都是根 */
void Initialize(DisjSet S)
{
    int i;

    for (i = NumSets; i > 0; i--)
        S[i] = 0;
}

/* 合并，将Root2的根设置为Root1 */
void SetUnion(DisjSet S, SetType Root1, SetType Root2)
{
    S[Root2] = Root1;
}

/* 查找根，递归直到值为0，就找到了一个根，返回在数组中的位置 */
SetType Find(ElementType X, DisjSet S)
{
    if (S[X] <= 0)
        return X;
    else
        return Find(S[X], S);
}

两种灵巧求并的改进：

1.按大小求并

上面的代码中，union操作是无条件的，可以按大小求并，每次将小的合并到大的上，这样，深度最多是logN，因为每次合并都被放到至少是原来节点2倍的树中，一共可以合并logN次，也就是说find操作的时间是logN，M次find操作的时间是O(MlogN)，最坏情况就是二项队列中的二项树。改进方法是，原来数组中值为0表示是根，改成节点个数的负值，初始时所有节点都是-1，后续union的时候，根所在节点的负值增加

2.按高度求并

和按大小求并类似，也保证深度最多O(logN)，按高度求并代码如下

void SetUnion(DisjSet S, SetType Root1, SetType Root2)
{
    /* 若Root2更深，那么将Root1合并到Root2上 */
    if (S[Root2] < S[Root1])
        S[Root1] = S[Root2];
    else
    {
        /* 若高度相等，那么增加高度 */
        if (S[Root1] == S[Root2])
            S[Root1]--;
        S[Root2] = Root1;
    }
}

路径压缩：对于连续M次操作，平均时间是O(M)，但是最坏的O(MlogN)时间会发生，比如union之后形成了一个二项树。对union无法改进，因为无论按照何种方法执行union，都会造出来一个相同的最坏情形的树，也就是二项树，改进find如下：每次find(X)之后，从X到根的每个节点都让它的父节点变成根，只要对代码进行一点改进就可以实现，如下：

SetType Find(ElementType X, DisjSet S)
{
    if (S[X] <= 0)
        return X;
    else
        return S[X] = Find(S[X], S);
}

路径压缩和按照大小求并完成兼容，但是和按高度求并不兼容，因为会修改树的高度，但是可以使用秩，作为估计的高度

按秩求并和路径压缩的最坏情形：使用这两种方法，算法在最坏情形下几乎是线性的，精确时间是 $\Theta (M\alpha (M,N)),M\geqslant N$ ，其中， $\alpha(M,N)$ 是Ackermann函数的逆，Ackermann函数如下定义：

$A(1,j)=2^j,j\geqslant 1$

$A(i,1)=A(i-1,2),i\geqslant 2$

$A(i,j)=A(i-1,A(i,j-1)),i,j\geqslant 2$

由此定义 $\alpha (M,N)=min\left \{ i\geqslant 1|A(i,\left \lfloor M/N \right \rfloor)> logN \right \}$ ，在实际应用中， $\alpha(M,N)\leqslant 4$ 。单变量反Ackermann函数写成 $log^{*}N$ ，是N的直到 $N\leqslant 1$ 的取对数的次数， $log^{*}65535= 4$ ， $log^{*}2^{65536}= 5$ ， $\alpha(M,N)$ 增长的比 $log^{*}N$ 还慢，不过不是常数，导致时间不是线性的