并查集——CCF201703-4——地铁修建
并查集总结
并查集,“并”——就是将一个个原本分散的、却相关的数据并在一起(放入一个用特定序号标记的集合中);“查”——可以通过某个数据所在集合对应的标记序号,检查它与另外一个数据是否在同一集合当中。
具体实现
具体实现过程很简单。首先使每个分散的元素自成一个集合,集合标号即为元素的数组下标序号。若某两个集合中的数据存在关系,则归并为一个集合,新集合的下标号取这两个集合下标号二者任意之一。每个集合可以看做是一棵树,根节点的数组下标序号就看做此集合的标记序号;另外,开设一个数组father[],用来保存每个节点的父节点的下标(根节点的父节点即为本身),这样,就可以通过迭代寻找某点的父节点,直到找到根节点,知道了根节点的下标,也就知道此节点所在集合的标号啦;知道了根节点的下标,也就能实现归并集合,归并方法为将某个根节点的父节点设为另一个根节点。
下面给一个直观些的例子
如下图,集合1和集合2中的数据3和数据4检测到存在关系,则应将集合1和集合2归并为一个集合。
通过找到数据3和数据4的根节点,分别为数据1和2,然后将1的父节点设为2,或者将2的父节点设为1,效果都一样,可以将这两个集合归并。
或
容易出现的问题
刚开始使用并查集时,我犯过的一个错是在归并集合时,将存在关系的两个数据相互设为父子节点,而不是将它们的根节点相互设为父子节点。拿上面的例子来说,这样做会出现如下错误情况:
可以看到,这么做虽然使3和4节点在一个集合当中了,但是2节点却出错了,2本来也应该在集合当中。所以正确做法是使2的父节点为1,这样它们就都在一个集合当中了。你可能会问,使2的父节点为3或5不行吗?当然也行,只是这样的话,在寻找2及2的子节点的根节点时,就要付出更多的时间了,效率很低。这里再说一下,1作2的父节点或者2作1的父节点是无所谓的,都可以达到目的。但是有些题目,要找1结点和x结点是否连通(即1和x是否在同一集合中),那么每次选择数组下标小的节点作为根节点就是个不错的选择,为什么呢?因为这样的话,1节点就只能作为根节点了(不存在比1下标还小的节点),这样在判断x和1是否在同一集合中时,就不用寻找1的根节点的数组下标了,因为它只能为1,稍微能节约点时间吧。
下面给一道例题
CCF-201703-4-地铁修建
问题描述
A市有n个交通枢纽,其中1号和n号非常重要,为了加强运输能力,A市决定在1号到n号枢纽间修建一条地铁。
地铁由很多段隧道组成,每段隧道连接两个交通枢纽。经过勘探,有m段隧道作为候选,两个交通枢纽之间最多只有一条候选的隧道,没有隧道两端连接着同一个交通枢纽。
现在有n家隧道施工的公司,每段候选的隧道只能由一个公司施工,每家公司施工需要的天数一致。而每家公司最多只能修建一条候选隧道。所有公司同时开始施工。
作为项目负责人,你获得了候选隧道的信息,现在你可以按自己的想法选择一部分隧道进行施工,请问修建整条地铁最少需要多少天。
输入格式
输入的第一行包含两个整数n, m,用一个空格分隔,分别表示交通枢纽的数量和候选隧道的数量。
第2行到第m+1行,每行包含三个整数a, b, c,表示枢纽a和枢纽b之间可以修建一条隧道,需要的时间为c天。
输出格式
输出一个整数,修建整条地铁线路最少需要的天数。
样例输入
6 6
1 2 4
2 3 4
3 6 7
1 4 2
4 5 5
5 6 6
样例输出
6
样例说明
可以修建的线路有两种。
第一种经过的枢纽依次为1, 2, 3, 6,所需要的时间分别是4, 4, 7,则整条地铁线需要7天修完;
第二种经过的枢纽依次为1, 4, 5, 6,所需要的时间分别是2, 5, 6,则整条地铁线需要6天修完。
第二种方案所用的天数更少。
评测用例规模与约定
对于20%的评测用例,1 ≤ n ≤ 10,1 ≤ m ≤ 20;
对于40%的评测用例,1 ≤ n ≤ 100,1 ≤ m ≤ 1000;
对于60%的评测用例,1 ≤ n ≤ 1000,1 ≤ m ≤ 10000,1 ≤ c ≤ 1000;
对于80%的评测用例,1 ≤ n ≤ 10000,1 ≤ m ≤ 100000;
对于100%的评测用例,1 ≤ n ≤ 100000,1 ≤ m ≤ 200000,1 ≤ a, b ≤ n,1 ≤ c ≤ 1000000。
所有评测用例保证在所有候选隧道都修通时1号枢纽可以通过隧道到达其他所有枢纽。
代码块
#include<iostream>
#include<algorithm>
using namespace std;
int **map = new int *[200001];
int father[200001];
int n, m;
bool compare(int *a, int *b){
if(a[2]<b[2])
return true;
else
return false;
}
int find_father(int x)
{
int r=x;
while(r!=father[r])
r=father[r];
//路径压缩
while(x!=father[x]){
int i=father[x];
father[x]=r;
x=i;
}
return r;
}
int main(){
scanf("%d%d", &n, &m);
for(int i=1; i<=n; i++)
father[i] = i;
for(int i=0; i<m; i++){
map[i] = new int [3];
scanf("%d%d%d", &map[i][0], &map[i][1], &map[i][2]);
}
sort(map, map+m, compare);
for(int i=0; i<m; i++){
int a, b;
a = find_father(map[i][0]);
b = find_father(map[i][1]);
if(a==b)
continue;
if(a<b)
father[b]=a;
else
father[a]=b;
if(find_father(n)==1)
{
printf("%d\n", map[i][2]);
break;
}
}
return 0;
}
上面这道题用了Kruskal算法,在归并集合时,就是使数组下标小的作为根节点,因为题目给的要求就是从1到n,这样做在最后一步不用寻找1的根节点(1的根节点只能为1),直接判断 “if(find_father(n)==1)” 就好。但这也不是绝对的,视具体情况而定。