union-find算法

在《算法》第4版中,union-find是第一章最后的一个算法介绍,也叫做并查集,在维基百科中是这样解释并查集的:在计算机科学中,并查集是一种树型的数据结构,用于处理一些不交集(Disjoint Sets)的合并及查询问题。有一个联合-查找算法union-find algorithm)定义了两个用于此数据结构的操作:

  • Find:确定元素属于哪一个子集。它可以被用来确定两个元素是否属于同一子集。
  • Union:将两个子集合并成同一个集合。

说了这么一大堆,其实就是相当于垃圾分类?只不过这些“垃圾”之间有一些联系,将这些有联系的“垃圾”分在一起,构成一个个“垃圾堆”,而这个算法就是将“垃圾”进行分类的过程。而书中所说的分量就是一个个的”垃圾堆“。最开始每一个垃圾都是一个“垃圾堆”,因此最开始有N个分量,然后根据两两之间的联系,两个“垃圾堆”组成一个更大的“垃圾堆”。而实际中应用就类似QQ里面的共同好友推荐中找到共同好友的算法吧。

下面给出书中的代码:

顺便给出algs4.jar包,这个包是书的作者封装好的一些方法。

这个链接里面有algs4.jar包 https://blog.csdn.net/weixin_44292560/article/details/105566825

首先是书中的第一种方法:

/**
 * @Author: 商火
 * @Date: 2020/4/16 19:05
 * @Description:
 */
public class UF{
    private int[] id;   // 分量id(以触点作为索引)---垃圾(一开始每个垃圾都是一个垃圾堆)
    private int count;  // 分量数量---垃圾堆

    public UF(int N){
        count = N;	
        id = new int[N];
        for (int i = 0; i < N; i++) {
            id[i] = i;
        }
    }

    public int count(){
        return count;
    }

    public boolean connected(int p,int q){
        return find(p) == find(q);
    }


    public int find(int p) {
        return id[p];
    }



    public void union(int p,int q){
        //将p,q归并到相同的分量(垃圾堆)中
        int pID = find(p);
        int qID = find(q);

        //如果q和p已经在相同的分量(垃圾堆)之中则不需要采取任何行动
        if(qID == qID){
            return;
        }

        //将 p的分量重命名为q的名称---合并垃圾堆
        for(int i=0;i<id.length;i++){
            if(id[i]==pID){
                id[i] = qID;
            }
        }
        count--;
    }
}

其实弄懂了这个算法是要做什么,理解代码反而变得简单了。

现在看这个算法不免觉得它有点复杂了,每一个“垃圾”都要遍历全部的“垃圾”找到与之在同一个“垃圾堆”(分量),然后归并。而实际上,我们只需要对两个分量(垃圾堆)进行归并,而不是一个一个垃圾的进行归并,在这里,我们将每一个垃圾堆看作一个集合(其实这是有问题的,后面我会说到),每次归并只需要判断p垃圾堆中的垃圾是否和q垃圾堆中的垃圾有联系,如果有联系,就将p垃圾堆和q垃圾堆归并,成为一个大的垃圾堆,而这时这个大垃圾的id可能是由p融入q,也可能是由q融入p,而这两个是有区别的。

这里只给出有变化的两个方法代码:

public int find(int p) {
        while(p!=id[p]) p = id[p];
        return p;
    }

public void union(int p,int q){
    //将q和p根节点统一
    int pRoot = find(p);
    int qRoot = find(q);
    if(qRoot == pRoot)	return;
    id[pRoot] = qRoot;
    count--;
}

关于上面这个方法一开始我想到的就是这种,但是我并没有把它当作一棵,而是一个集合,因为宏观上两个分量(垃圾堆)的归并的就是两个集合的合并,但实际上这个归并的过程是有深度的,而这树的深度也决定了方法的效率,这也是我前面说将它看出集合是有问题的原因。

而方法三就是对方法二的改进,在方法二的基础上添加权重的属性,使小的树融入大的树(遍历的深度更浅),而不是反过来,这也是前面我所说的区别。

下面给出代码:

/**
 * @Author: 商火
 * @Date: 2020/4/16 19:05
 */
public class WeightedQuickUnionUF {
    private int[] id;   // 分量id(以触点作为索引)
    private int[] sz;   //各个根节点所对应的分量的大小
    private int count;  // 分量数量

    public WeightedQuickUnionUF(int N){
        count = N;
        id = new int[N];
        for (int i = 0; i < N; i++) {
            id[i] = i;
            sz[i] = 1;
        }
    }

    public int count(){
        return count;
    }

    public boolean connected(int p,int q){
        return find(p) == find(q);
    }

    private int find(int p){
        while (p!=id[p]) p = id[p];
        return p;
    }

    public void union(int p,int q){
        int i = find(p);
        int j = find(q);
        if(i ==j) return;

        //将小叔的根节点连接到大树的根节点
        if(sz[i]<sz[j]){
            id[i] = j;
            sz[j]+=sz[i];
        }else{
            id[j] = i;
            sz[i]+=sz[j];
        }
        count--;
    }
}
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值