给定一张边带权的无向图G=(V,E),n=|V|,m=|E|。由V中全部n个顶点和E中 n-1 条边构成的无向联通子图被称为G的一颗生成树。边的权值之和最小的生成树被称为无向图G的最小生成树(Minimum Spanning Tree,MST)。
定理:任意一颗最小生成树无向图中权值最小的边。
证明:反证法。假设无向图G=(V,E)存在一棵最小生成树不包含权值最小的边。设e=(x,y,z)是无向图中权值最小的边。把e添加到树中,e会和树上从x到y的路径构成一个环,并且环上其他边的权值都比z大。因此,用e代替环上的其他任意一条边,会形成一颗权值和更小的生成树,与假设矛盾。故假设不成立,原命题成立。
推论:
给定一张无向图G=(V,E),n=|V|,m=|E|。从E中选出k<n-1 条边构成G的一个生成森林。若再从剩余的m-k条边中选出n-1-k条添加到生成森林中,使其成为G的生成树,并且选出的边权值之和最小,则该生成树一定包含这m-k条边中连接生成森林的两个不连通节点的权值最小的边。Kruskal 算法
Kruskal算法就是基于上述推论的。Kruskal算法总是维护无向图的最小生成森林。最初,可认为生成森林由0条边构成,每个节点各自构成仅包含一个节点的树。
在任意时刻,Kruskal算法从剩余的边中选出一条权值最小的,并且这条边的两个端点属于生成森林中两个不同的树(不连通),把该边加入生成森林。图中节点的连通情况可以用并查集维护。
详细来说,Kruskal算法建立如下:
1. 建立并查集,每个节点各自构成一个集合。
2. 把所有边按照权值从大到小排序,依次扫描每条边(x,y,z)。
3. 若x,y属于用同一个集合(连通),则忽略这条边,继续扫描下一条。
4. 否则,合并x,y所在的集合,并把z累加到答案中。
5. 把所有边扫描完成后,第4布处理过的边就构成最小生成树。
时间复杂度O(mlogm)。
struct rec{int x,y,z}edge[500010];
int fa[10010],n,m,ans;
bool operator<(rec a,rec b) {
return a.z<b.z;
}
int get(int x){
if(x==fa[x]) return x;
return fa[x]=get(fa[x]);
}
int main(){
cin>>n>>m;
for(int i=1;i<=m;i++)
cin>>edge[i].x>>edge[i].y>>edge[i].z;
sort(edge+1,edge+m+1);
for(int i=1;i<=n;i++) fa[i]=i;
for(int i=1;i<=m;i++) {
int x=get(edge[i].x);
int y=get(edge[i].y);
if(x==y) continue;
fa[x]=y;
ans+=edge[i].z;
}
cout<<ans<<endl;
}
Prim算法
Prim 算法同样基于上述理论,但思路略有改变。Prim算法总是维护最小生成树的一部分。最初,Prim算法仅确定1号节点属于最小生成树。
在任意时刻,设已经属于最小生成树的节点集合为T,剩余节点集合为S。Prim算法找到min{Z},即两个端点分别属于集合S,T的权值最小的边,然后把点x从集合S中删除,加到集合T,并把x累加到答案中。具体来说,可以维护数组d:若x属于S,则d[x]表示节点x与集合T中的节点之间权值最小的边的权值。若x属于T,则d[x]就等于x被加入T时选出的最小边的权值。
可以类比Dijkstra算法,用一个数组标记节点是否属于T。每次从未标记的节点中选出d值最小的,把它标记(新加入T),同时扫描所有出边,更新另一个端点的d值。最后,最小生成树的权值总和就是d[2]+……d[n]。
Prim算法时间复杂度为O(n*n),可以用二叉堆优化到O(mlogn)。但用二叉堆优化不如直接使用Kruskal算法更方便。因此,Prim主要用于稠密图,尤其是完全图的最小生成树的求解。
int a[3010][3010],d[3010],n,m,ans;
bool v[3010];
void prim(){
memset(d,0x3f,sizeof(d));
memset(v,0x3f,sizeof(v));
d[1]=0;
for(i=1;i<n;i++){
int x=0;
for(int j=i;j<=n;j++)
if(!v[j]&&(x==0||d[j]<d[x])) x=j;
v[x]=1;
for(int y=1;y<=n;y++)
if(!v[y]) d[y]=min(d[y],a[x][y]);
}
}
int main(){
cin>>n>>m;
memset(a,0x3f,sizeof(a));
for(int i=1;i<=n;i++) a[i][i]=0;
for(int i=1;i<=m;i++) {
int x,y,z;
cin>>x>>y>>z;
a[y][x]=a[x][y]=min(a[x][y],z);
}
prim();
for(int i=2;i<=n;i++) ans+=d[i];
cout<<ans<<endl;
}