并查集（HDU1232）

最新推荐文章于 2020-06-16 14:42:08 发布

anhudan9494

最新推荐文章于 2020-06-16 14:42:08 发布

阅读量95

点赞数

文章标签：数据结构与算法

原文链接：http://www.cnblogs.com/sunhaotian/articles/5183021.html

版权

　　　　在一些有N个元素的集合应用问题中，我们通常是在开始时让每个元素构成一个单元素的集合，然后按一定顺序将属于同一组的元素所在的集合合并，其间要反复查找一个元素在哪个集合中。这一类问题其特点是看似并不复杂，但数据量极大，若用正常的数据结构来描述的话，往往在空间上过大，计算机无法承受；即使在空间上勉强通过，运行的时间复杂度也极高，根本就不可能在规定的运行时间（1～3秒）内计算出试题需要的结果，只能用并查集来描述。

定义

并查集（Disjoint Set），即“不相交集合”，是一种树型的数据结构，用于处理一些不相交集合（Disjoint Sets）的合并及查询问题。常常在使用中以森林来表示。集就是让每个元素构成一个单元素的集合，也就是按一定顺序将属于同一组的元素所在的集合合并。

将编号分别为1…N的N个对象划分为不相交集合，在每个集合中，选择其中某个元素代表所在集合。

常见两种操作：

合并两个集合
查找某元素属于哪个集合

用编号最小的元素标记所在集合；定义一个数组 set[1..n] ，其中set[i] 表示元素i 所在的集合；

算法实现

查找 Θ(1)

find1(x)
{
    return set[x];
}

合并 Θ(N)

Merge1(a,b)
{   
    i = min(a,b);
    j = max(a,b);
    for (k = 1; k <= N; k++) {
        if (set[k] == j)
            set[k] = i;
    }
}

对于“合并操作”，必须搜索全部元素！有没有可以改进的地方呢？

算法的优化

使用树结构

每个集合用一棵“有根树”表示，定义数组 set[1..n]

set[i] = i , 则i表示本集合，并是集合对应树的根
set[i] = j, j<>i, 则 j 是 i 的父节点.

查找最坏情况Θ(N)

find2(x)
{
   r = x;
   while (set[r] != r)
      r = set[r];
   return r;
}

合并 Θ(1)

merge2(a, b)
{
    if (a<b)
       set[b] = a;
    else
       set[a] = b;
}

性能有无本质的改进？如何避免最坏情况呢？

优化--避免最坏情况

方法：将深度小的树合并到深度大的树

实现：假设两棵树的深度分别为h1和h2, 则合并后的树的高度h是:

max(h1,h2), if h1<>h2.

h1+1, if h1=h2.

效果：任意顺序的合并操作以后，包含k个节点的树的最大高度不超过lgk

优化后算法及效率：

查找 Θ(N)

find2(x)    
{
   r = x;
   while (set[r] != r)
      r = set[r];
   return r;
}

合并 Θ(1)

merge3(a,b)
{ 
    if (height(a) == height(b)) {
       height(a) = height(a) + 1;
       set[b] = a; 
    } else if (height(a) < height(b)) {
       set[a] = b;
    } else {  
       set[b] = a; 
    }
}

进一步优化--路径压缩

思想：每次查找的时候，如果路径较长，则修改信息，以便下次查找的时候速度更快

步骤:

第一步，找到根结点
第二步，修改查找路径上的所有节点，将它们都指向根结点

带路径压缩的查找算法：

find3(x)
{
      r = x;
      while (set[r]  !=  r) //循环结束，则找到根节点
          r = set[r];       
      i = x;
      while (i != r) //本循环修改查找路径中所有节点
      {   
          j = set[i];
         set[i] = r;
          i = j;
      }
}

路径压缩示意图:

　　　　比较懒，转载于：http://www.cnblogs.com/archimedes/p/disjoint-set.html

以HDU1232为例

我的代码：

#include<stdio.h>
int x[1005];
int min(int a,int b);
int max(int a,int b);
void xs(int a,int b);
int fine(int a);
int main()
{
    int n,m,i,a,b;
    while(scanf("%d",&n)&&n)
    {
        int sum = -1;
        scanf("%d",&m);
        for(i=1;i<=n;i++) x[i]=i;   /*首先把各自的父节点设为自身。*/
        for(i=1;i<=m;i++)
        {
            scanf("%d%d",&a,&b);
            xs(a,b);  /*合并两个集合。*/
        }
        for(i=1;i<=n;i++)
        {
            if(x[i]==i) sum++;    /*算出（最后不同集合的个数-1）即为所求。*/
        }
        printf("%d\n",sum);
    }
    return 0;
}
int min(int a,int b)
{
    return a<b ? a : b;
}
int max(int a,int b)
{
    return a>b ? a : b;
}
int fine(int a)
{
    if(x[a]==a) return a;
    else return fine(x[a]);
}
void xs(int a,int b)
{
    x[max(fine(a),fine(b))] = min(fine(a),fine(b));
}

View Code

转载于:https://www.cnblogs.com/sunhaotian/articles/5183021.html

anhudan9494

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
并查集（HDU1232）

　　　　在一些有N个元素的集合应用问题中，我们通常是在开始时让每个元素构成一个单元素的集合，然后按一定顺序将属于同一组的元素所在的集合合并，其间要反复查找一个元素在哪个集合中。这一类问题其特点是看似并不复杂，但数据量极大，若用正常的数据结构来描述的话，往往在空间上过大，计算机无法承受；即使在空间上勉强通过，运行的时间复杂度也极高，根本就不可能在规定的运行时间（1～3秒）内计算出试题需要的...
复制链接

扫一扫