最小生成树快速入门【Prim&Kruskal】
1 何为最小生成树?
要认识最小生成树,我们或许要先了解生成树的概念。
生成树(Spanning Tree):指在一个无向图中,包含图中V个顶点和V-1条边的的子连通图(不妨设V为图的节点个数)。
而最小生成树(Minimum Spanning Tree,简称MST)就是生成树中权值和最小的树。
2 何以求解最小生成树?
求解最小生成树的常见算法包括普里姆算法(Prim’s Algorithm)、克鲁斯卡尔算法(Kruskal’s Algorithm)和索尔连科算法(Borůvka’s Algorithm)。这些算法在不同的情况下有不同的效率和适用性,简要概括如下:
- 普里姆算法 (Prim’s Algorithm):
- 适用于边权重差异较大的图。
- 开始于图中的一个顶点,逐步增加新的边和顶点,直到形成最小生成树。
- 每次都选择连接已选顶点集与未选顶点集中权重最小的边。
- 算法的时间复杂度为 O(E+VlogV)(其中 E 是边数,V 是顶点数)。
- 克鲁斯卡尔算法 (Kruskal’s Algorithm):
- 适用于边权重差异较小的图。
- 先将所有边按权重排序,然后按顺序选择边,只要这条边不会与已经选择的边形成环,就加入到生成树中。
- 适用于包含多个连通分量的图。
- 算法的时间复杂度也为 O(E+VlogV)。
- 索尔连科算法 (Borůvka’s Algorithm):
- 适用于任何类型的图。
- 初始化时每个顶点都是一个独立的树。
- 然后每次找到每个连通分量中权重最小的边,并将其加到森林中,直到森林变成一棵树。
- 算法的时间复杂度为 O(ElogV)。
由于蒟蒻也才刚学习,因此在这里只谈论更常用的Prim和Kruskal算法。
悄悄告诉你,蒟蒻听佬说,在做算法题是,用Kruskal算法更多哦。
2.1 Prim
Prim是基于点的算法,朴素的做法时间复杂度为O(n^2)(n是顶点数)堆优化后为O(nlogn);由于与图中边数无关,所以相较之下,更适用于稠密图。
基本思想:
- 初始化:选择图中的任一顶点(通常为1),并将其加入最小生成树中。
- 选择最小权重的边的点:在剩余的顶点中,找到与已选顶点集合连接的边是最小权重的点。
- 添加顶点,更新距离(权重):将这个顶点加入到最小生成树中,并更新距离。
- 重复步骤2和3:重复选择最小权重的边与顶点的步骤,直到所有的顶点都被加入最小生成树中。
- 结束:当所有的顶点都被加入最小生成树,算法结束,此时形成的树就是最小生成树。
伪代码:
// 选任一点为起点(不妨为1)
// for(n-1次){
// 每次确定一条边
// 在所有点中找离intree中的点最近的点
// 加入intree,更新所有点到intree中任意点的最近距离d[]
// }
Prim核心:维护一个intree集合,每次从外面找一个最近的(相邻的)加入,加入后更新邻接点。
2.1.1 朴素实现 利用Array 【时间复杂度O(n^2)】
代码如下:
#include <bits/stdc++.h>
using namespace std;
using ll = long long;
const int N = 1e3 + 9;
const ll inf = 4e18,p = 998244353;
ll a[N][N],d[N]; // 用邻接矩阵来存 数据范围不能可过大
bitset<N> intree;
void solve()
{
// input
int n,m;cin >> n >> m;
// 初始化inf
memset(a,0x3f3f3f3f,sizeof(a));
memset(d,0x3f3f3f3f,sizeof(d));
for(int i = 1;i <= m;i ++)
{
ll u,v,w;cin >> u >> v >> w;
// 无向图
a[u][v] = min(a[u][v],w);
a[v][u] = min(a[v][u],w);
}
ll ans = 0;
// 将1顶点加入intree,并更新状态和距离
intree[1] = true;
d[1] = 0;
for(int j = 1;j <= n;j ++)
{
// j点在树内,跳过
if(intree[j]) continue;
// 更新距离
d[j] = min(d[j],a[1][j]);
}
for(int i = 1;i < n;i ++)
{
int u = 1; // u是我们要找的距离intree中的点最近的点
for(int j = 1;j <= n;j ++)
{
// 若u在树内,则直接换;不在,判断j是否不在树内且d[j]<d[u]
if(intree[u] || (!intree[j] && d[j] < d[u])) u = j;
}
ans += d[u];
// 已在树内,更改状态
intree[u] = true;
d[u] = 0;
// 更新所有点到intree中任意点的最短距离
for(int j = 1;j <= n;j ++)
{
if(intree[j]) continue;
d[j] = min(d[j],a[u][j]);
}
}
// output
cout << ans << '\n';
}
int main(void)
{
ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);
int _;cin >> _;
while(_ --)
{
solve();
}
return 0;
}
或
#include <bits/stdc++.h>
using namespace std;
using ll = long long;
const int N = 1e3 + 9;
const ll inf = 4e18,p = 998244353;
ll a[N][N],d[N]; // 邻接矩阵 数据范围不能过大
bitset<N> intree;
void solve()
{
// input
int n,m;cin >> n >> m;
// 初始化
memset(a,0x3f3f3f3f,sizeof(a));
memset(d,0x3f3f3f3f,sizeof(d));
// 建图
for(int i = 1;i <= m;i ++)
{
ll u,v,w;cin >> u >> v >> w;
a[u][v] = min(a[u][v],w);
a[v][u] = min(a[v][u],w);
}
ll ans = 0;
for(int i = 1;i <= n;i ++)
{
int u = 1; // u是我们要找的距离intree中的点最近的点
for(int j = 1;j <= n;j ++)
{
if(intree[u] || (!intree[j] && d[j] < d[u])) u = j;
}
// 第一次intree中并无元素,其d[u]是inf,不能加入ans
if(d[u] < inf) ans += d[u];
intree[u] = true;
d[u] = 0;
// 更新距离
for(int j = 1;j <= n;j ++)
{
if(intree[j]) continue;
d[j] = min(d[j],a[u][j]);
}
}
cout << ans << '\n';
}
int main(void)
{
ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);
int _;cin >> _;
while(_ --)
{
solve();
}
return 0;
}
2.1.2 堆优化 利用priority_queue 【时间复杂度O(VlogV)】(V=>顶点数)
#include <bits/stdc++.h>
using namespace std;
using ll = long long;
const int N = 1e5 + 9;
const ll inf = 4e18,p = 998244353;
// 距离(权重)
ll d[N];
// 最小生成树
bitset<N> intree;
// 边
struct Edge
{
ll x,w; // 出点,权值
bool operator < (const Edge& u) const
{
return w == u.w ? x < u.x : w > u.w;
}
};
// 图
vector<Edge> g[N];
void solve()
{
// input
int n,m;cin >> n >> m;
// 初始化
memset(d,0x3f3f3f3f,sizeof(d));
// 建图
for(int i = 1;i <= m;i ++)
{
ll u,v,w;cin >> u >> v >> w;
g[u].push_back({v,w});
g[v].push_back({u,w});
}
ll ans = 0;
priority_queue<Edge> pq;
// 初始化,加入一个点
d[1] = 0;
pq.push({1,0});
while(pq.size())
{
// 距离intree中最近的点
auto [x,w] = pq.top();pq.pop();
if(intree[x]) continue; // 若在树内,跳过
intree[x] = true; // 更改状态
ans += w;
d[x] = 0;
// 枚举所有出边
for(auto &[y, w] :g[x])
{
// 不在树内并且权值更小才push
if(!intree[y] && w < d[y])
{
d[y] = w; // 更新距离
pq.push({y,w});
}
}
}
// 检查是否有点不在树内,若有,则未生成
for(int i = 1;i <= n;i ++)
{
if(!intree[i])
{
ans = -1;
break;
}
}
cout << ans << '\n';
}
int main(void)
{
ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);
int _ = 1; // cin >> _;
while(_ --)
{
solve();
}
return 0;
}
2.2 Kruskal 贪心 【时间复杂度 O(mlogm)】
Kruskal是基于边的算法,主要思想是贪心,所以用到了排序,时间复杂度几乎是O(mlogm)(m 是边数)(因为并查集的操作可近似看作O(1)),所以更适用于稀疏图(Sparse graph)。
基本思想:
贪心
1)给边从小到大排序
2)从小到大选边
{u,v,w}
若u,v已联通:跳过【判断联通用并查集】
若u,v未联通:选上,并连接
一个模板题:
P72 【模板】最小生成树
代码如下:
#include <bits/stdc++.h>
using namespace std;
using ll = long long;
const int N = 1e5 + 9;
const ll inf = 4e18,p = 998244353;
// 距离(权重)
ll d[N];
struct Edge// 边
{
ll u,v,w;// 入点,出点,权值
bool operator < (const Edge& m) const // 重载运算符,排序
{
return w == m.w ? (u == m.u ? v < m.v : u < m.u) : w < m.w;
}
};
// 并查集
int pre[N];
int root(int x){return pre[x] = (pre[x] == x ? x : root(pre[x]));}
void solve()
{
// input
int n,m;cin >> n >> m;
// 初始化
memset(d,0x3f3f3f3f,sizeof(d));
vector<Edge> es;
// 建图
for(int i = 1;i <= m;i ++)
{
ll u,v,w;cin >> u >> v >> w;
es.push_back({u,v,w});
}
// 排序
sort(es.begin(),es.end());
ll ans = 0;
// 并查集初始化
for(int i = 1;i <= n;i ++) pre[i] = i;
for(auto &[u,v,w] : es)
{
// 如果联通,跳过
if(root(u) == root(v)) continue;
ans += w;
// 更新状态
pre[root(u)] = root(v);
}
// 判断是否形成了生成树
for(int i = 1;i < n;i ++) if(root(i) != root(i + 1)) {cout << -1;return;}
// output
cout << ans << '\n';
}
int main(void)
{
ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);
int _ = 1; // cin >> _;
while(_ --)
{
solve();
}
return 0;
}
虽说,这两个都可以求得最小生成树,但是我们不难发现,Prim算法中只记录了点被选择,并不知道点与点之间如何连接,当然我们可以编写记录它们如何连接的代码;但Kruskal算法算出权值的同时,也是记录下了边,包括其入点和出点,你可以画出最小生成树。次外,Kruskal在代码实现上也更简单之间,其实蒟蒻想说的是,在大多情况下,Kruskal或许会更好用。