摘要
最小生成树是图论中一类常见的问题,用来解决它的算法并不困难。其中Kruskal算法基于贪心思想以及最小生成树的一个定理(下文介绍),需要并查集辅助,适用于稀疏图;Prim同样基于贪心,需要借助二叉堆进行辅助,对于稠密图尤其是全图的最小生成树效率很快。本文主要介绍最小生成树的概念、用途以及相关算法。
前置知识
- 无向图
- 前向星存图
- 并查集
- 二叉堆
最小生成树
最小生成树问题就是用来解决如何用最小的“代价”用N-1条边连接N个点的问题。[1]
理论知识:
定理: 任意一棵最小生成树一定包含无向图中权值最小的边。
推论: 给定一张无向图 G = (V , E ) ,n = |V| , m = |E|。从 E中选出 k < n - 1条边构成 G 的一个生成森林。若再从剩余的 m-k条边中选 n - 1 - k 条添加到生成森林中,使其称为 G 的生成树,并且选出的边的权值之和最小,则该生成树一定包含这 m - k 条边中连接生成森林的两个不连通节点的权值最小的边。[1]
Kruskal算法
算法思路: Kruskal 算法就是基于上述推论的。Kruskal算法总是维护无向图的最小生成森林。最初,可认为生成森林由 0 条边构成,每个节点各自构成一棵仅包含一个点的树。
在任意时刻,Kurskal算法从剩余的边中选出一条权值的,并且这条边的两个端点属于生成森林中两棵不同的树(不连通),把该边加入生成森林。图中节点的连通情况就可以用并查集来维护。
算法流程:
- 建立并查集,每个节点各自构成一个集合。
- 把所有边按照权值从小到大排序,依次扫描每条边(x , y , z)。
- 若 x , y属于同一集合(即连通),则忽略这一条边,继续扫描下一条。
- 否则,合并x,y所在的集合,并把z累加到答案中。
- 所有边扫描完成后,第四步所处理过的边就构成最小生成树。
复杂度分析: 主要事件花费在于对边的排序上,若采用快速排序,该算法的时间复杂度就是O(m log m)。和Prim算法相比简洁且易写,大部分情况下适用。
代码模板: 见 code - 1
Prim 算法
算法思路: Prim算法同样基于上述推论,但思路略有不同。Prim算法总是维护最小生成树的一部分,即不断向一棵“子最小生成树”中添加节点,直至得到最终结果。最初,Prim算法仅确定1号节点属于最小生成树。
在任意时刻,设已经确定属于最小生成树的部分的节点集合为T,剩余节点集合为S。Prim算法每次找到两个端点分别属于结合 S , T 的权值最小的边(x , y , z),然后把点 x 从集合S中删除,加入到集合T,并把z累加到答案中。
类比Dijkstra算法,我们可以用一个标记数组标记节点是否属于T。每次从未标记的节点中选出d值最小的,把他标记(加入T),同时扫描其所有出边,更新另一个端点的d值。
优化: 按照上述描述,Prim算法的时间复杂度为O(N^2),但其中“找最小 d 值的节点”可以适用二叉堆优化,这样时间复杂度就是O(m * log n)。但这样牺牲了便捷性,所以Prim主要用于稠密图,尤其是完全图的最小生成树的求解。
代码模板: 见 code - 2
参考书目
- [1]《算法竞赛进阶指南》,李煜东,P335.
- 《信息学奥赛一本通》,董永建,P508.
附录
code-1 Kruskal算法模板
#include<cstdio>
#include<algorithm>
using namespace std;
const int N = 110;
struct Edge{
int from,to,d;
bool operator < (const Edge& B) const {
return d < B.d;
}
} edges[2*N*N];
int n,tot = 0;
int par[N];
void addEdge(int from,int to,int d){
edges[++tot].from = from;
edges[tot].to = to;
edges[tot].d = d;
}
int Find(int x){
if(par[x] == x) return x;
return par[x] = Find(par[x]);
}
void Merge(int x,int y){
par[Find(x)] = Find(y);
}
int main(){
scanf("%d",&n);
for(int i = 1;i <= n;i++){
for(int j = 1,x;j <= n;j++){
scanf("%d",&x);
addEdge(i,j,x);
addEdge(j,i,x);
}
par[i] = i;
}
int cnt = 0,ans = 0;
sort(edges+1,edges+tot+1);
for(int i = 1;i <= tot;i++){
int u = edges[i].from,v = edges[i].to,w = edges[i].d;
if(Find(u) == Find(v)) continue;
Merge(u,v);cnt++;ans += w;
if(cnt == n-1) break;
}
printf("%d\n",ans);
return 0;
}
code-2 Prim算法模板
#include<cstdio>
#include<cstring>
const int N = 3010;
int a[N][N],d[N],n,m,ans;
bool v[N]; //标记节点x是否在最小生成树中
int min(int a,int b){return a<b?a:b;}
void prim(){
memset(d, 0x3f,sizeof d);
memset(v,false,sizeof v);
d[1] = 0;
for(int i = 1;i < n;i++){
int x = 0;
//找到S集合中所有点到T集合连线中最短的节点
for(int j = 1;j <= n;j++)
if(!v[j] && (x == 0 || d[j] < d[x])) x = j;
v[x] = 1; //加入T集合
//利用新入T集合的节点x去更新S集合所有节点的d值
for(int y = 1;y <= n;y++)
if(!v[y]) d[y] = min(d[y],a[x][y]);
}
}
int main(){
scanf("%d",&n);
for(int i = 1;i <= n;i++)
for(int j = 1;j <= n;j++) scanf("%d",&a[i][j]);
prim();
for(int i = 2;i <= n;i++) ans += d[i];
printf("%d\n",ans);
return 0;
}