Kruskal算法
本文主要讲的是Kruskal算法,这是一种常用的用于寻找最小生成树的算法,由Joseph Kruskal于1956年发表。它是贪心的思想,易于编写,而且效率很高。
何为“最小生成树”呢?在一给定的无向图G = (V, E)中,(u, v)代表连接顶点u与顶点v的边,而w(u, v)代表此边的权重。连接G中所有的点,且边集T为E的子集的树(无环图),称为G的生成树(Spanning Tree)。若一个生成树的总权值w(T)最小,则称此生成树为G的最小生成树(MST, Minimal Spanning Tree)。
给出Kruskal算法的基本步骤思想如下:
1) 将原图中的所有边依据权值按照从小到大的顺序排列。(直接使用库函数sort即可)
2) 接下来按照权值从小到大考察每条边(u, v)。这时,若u和v已经处在同一个连通分量中,那么选择(u, v)后就会形成环,故显然不能选择;如果u和v还不在同一个连通分量中,那么就选择加入这条边。(贪心)因为当u和v不在同一连通分量中时,加入(u, v)一定是最优的。
为什么这么说呢?下用反证法给出一个简单的证明。
反设不加这条边能得到一个唯一最优解T,则T+(u, v)必有且仅有一个环。又因是从小到大考虑每条边的,故此环中至少存在一条边(u’, v’),其权值大于或等于(u, v)的权值。不妨在T上添加边(u, v),并删除边(u’, v’),即可得到一棵新树T’=T+(u, v)-(u’, v’)。这一T’的权值小于或等于原T的权值,与假设矛盾。故知加入(u, v)不会比不加入差。
如果不理解数学证明过程,不要紧,记住上述结论即可。下为用Kruskal算法构造最小生成树的示意图。
理解了上面的步骤,不难写出伪代码:
把原图中所有边按权值排序
初始化MST为空,以及初始化连通分量
for(int i = 0; i < m; i++)
if(e[i].u和e[i].v不在同一连通分量) {
把边e[i]加入MST
合并e[i].u和e[i].v所在的连通分量
}
显而易见,该代码中最关键的地方在于“连通分量的查询与合并”。当然,暴力求解肯定是可行的,因为DFS和BFS都可以判断图的连通性。可惜,这个方法不但复杂,而且效率低。因此,我们在这里使用并查集(Union-Find Set)。
并查集真的是一个极为精妙的方法,既简洁又高效。在本问题中,可以用集合来表示每个连通分量(各个连通的结点没有先后次序之分),而整个图的所有连通分量可以表示为一个“分划”(若干个交集为空,并集为全集的集合)。并查集的精妙之处在于用树来存储集合,用森林存储集族。例如,集族{ {1, 3, 4}, {2, 5} }需要用两棵树表示。这两棵树的具体形态是无关紧要的,只需一棵包含1, 3, 4三个点,一棵包含2, 5两个点即可。我们规定每棵树的根结点为这棵树所对应的集合的代表元。
简单分析一下,如果把x的父结点存为p[x]中(若x为根结点则p[x]=x),很容易查找出x所在集合的代表元:
int find(int x) {
return p[x] == x ? x : find(p[x]);
}
现在,如果某棵树中有一条很长的链状结构,那么递归的时候便要沿着链遍历大量数据,非常低效。那么并查集是如何实现高效的呢?注意到,集合没有先后次序,意味着树的形状结构无关紧要。因此,我们在每次遍历时,都可以顺便把这些结点改为根结点的子结点,这就大大提高了之后遍历的效率。这一操作,称为并查集的路径压缩。实现的办法其实很简单,只需把递归返回的结果赋值给p[x]即可。更改后的代码如下:
int find(int x) {
return p[x] == x ? x : p[x] = find(p[x]);
}
至此,我们已经讲完了Kruskal算法的核心内容以及并查集的使用方法。由于这一算法(尤其是并查集)极为重要,建议各位自行编写程序。
最后摆一道最小生成树的模板题:HDU1863,链接如下:
http://acm.hdu.edu.cn/showproblem.php?pid=1863
给出我写的Kruskal算法模板(也即HDU1863题解)如下:
#include<cstdio>
#include<iostream>
#include<algorithm>
#include<cstring>
#define maxn 102
using namespace std;
int n, m, p[maxn], sum, cnt;
struct Edge {
int u, v, w;
} e[maxn*maxn];
void Init() {
memset(e, 0, sizeof(e));
memset(p, 0, sizeof(p));
sum = 0;
cnt = 0;
}
bool cmp(Edge e1, Edge e2) {
return e1.w < e2.w;
}
int find(int x) {
return p[x] == x ? x : p[x] = find(p[x]);
}
void union_set(int u, int v, int w) {
u = find(u);
v = find(v);
if(u == v) return;
p[u] = v;
sum += w;
cnt++;
}
int main() {
while(cin >> m >> n && m) {
Init();
for(int i = 0; i < m; i++) {
cin >> e[i].u >> e[i].v >> e[i].w;
}
sort(e, e+m, cmp);
for(int i = 1; i <= n; i++)
p[i] = i;
for(int i = 0; i < m; i++) {
union_set(e[i].u, e[i].v, e[i].w);
}
if(cnt != n-1) cout << "?\n";
else cout << sum << endl;
}
return 0;
}