定理:任意一棵最小生成树一定包含无向图中权值最小的边。
证明:假设无向图G=(V,E)存在一棵最小生成树不包含权值最小的边。设e=(x,y,z)是无向图中权值最小的边。把e添加到树中,e会和树上从x到y的路径一起构成一个环,并且环上其它边的权值都比z大。因此,用e代替环上的其它任意一条边,会形成一棵权值和更小的生成树,与假设矛盾。因此假设不成立,原命题成立。
推论:给定一张无向图G=(V,E),n=|V|,m=|E|。从E中选出k<n-1条边构成G的一个生成森林。若再从剩余的m-k条边中选n-1-k条添加到生成森林中,使其成为G的生成树,并且选出的边的权值之和最小,则该生成树一定包含这m-k条边中连接生成森林的两个不联通节点的权值最小的边。 --------以上来自《算法竞赛进阶指南》
1.Kruskal算法
步骤:First:建立并查集,起初,每个点各自构成一个集合。
Second:把所有的边按照权值从小到大排序,依次扫描每条边(x,y,z)。
Third1:若x,y属于同一集合,就跳过。
Third2:若x,y不属于同一集合,合并x,y所在的集合,并把z累加到答案中。
Last:所有边扫描完成后,Third2中处理过的边就构成最小生成树。
时间复杂度:O(mlog m)
代码:
#include<iostream>
#include<cstdio>
#include<cmath>
#include<algorithm>
#define maxn 10005
using namespace std;
int fa[maxn];//父节点
int n,m;
int ans;//最小生成树的边权和
struct node{//结构体存边
int x,y,z;
}edge[maxn];
bool operator < (node a,node b)//结构体排序,按照边的长度从小到大排
{
return a.z<b.z;
}
int get(int x)//并查集
{
if(x==fa[x]) return x;
else return fa[x]=get(fa[x]);
}
int main()
{
scanf("%d%d",&n,&m);
for(int i=1;i<=m;i++)
scanf("%d%d%d",&edge[i].x,&edge[i].y,&edge[i].z);
sort(edge+1,edge+m+1);
for(int i=1;i<=n;i++)
fa[i]=i;
for(int i=1;i<=m;i++)
{
int d1=get(edge[i].x);
int d2=get(edge[i].y);
if(d1==d2) continue;//在同一集合,也就是前面有更短的边连接了它们,跳过
else fa[d1]=d2;//不在同一集合,把它们加入到同一集合
ans+=edge[i].z;//累加最小生成树的边权
}
printf("%d",ans);
return 0;
}
2.Prim算法
步骤:First :创建两个集合T,S,T集合里放已经确定属于最小生成树的节点,S集合里放剩余的节点,起初T集合里只有1号节点,剩下的都在S集合中。
Second:找到一条分别由T集合里的点和S集合的点所连成的最短的边,把这个S集合里的点放到T集合中,并且在S集合中删除该点,累计答案。
Last:重复Second,直至S集合中不存在元素。
时间复杂度O(n²),当然,使用二叉堆优化可以到达O(mlog n),但是过于复杂,正是因为这样,Prim算法主要运用于稠密图。
代码:
#include<iostream>
#include<cstdio>
#include<cmath>
#include<cstring>
#define maxn 1005
using namespace std;
int a[maxn][maxn],dist[maxn];//邻接矩阵存图
bool vis[maxn];
int n,m;
int ans;
void prim()
{
memset(dist,0x3f,sizeof(dist));//初始化
dist[1]=0;
for(int i=1;i<n;i++)
{
int x=0;
for(int j=1;j<=n;j++)
if(!vis[j]&&(x==0||dist[j]<dist[x])) x=j;//在S集合中选择与T集合中节点连边最短的点
vis[x]=1;//把它在S集合中删除并放到T集合中
for(int k=1;k<=n;k++)
if(!vis[k]) dist[k]=min(dist[k],a[x][k]);//判断一下x节点与S集合中剩下节点所连边的边长是否会更新剩余节点的dist值
}
}
int main()
{
scanf("%d%d",&n,&m);
memset(a,0x3f,sizeof(a));
for(int i=1;i<=n;i++) a[i][i]=0;
for(int i=1;i<=m;i++)
{
int x,y,z;
scanf("%d%d%d",&x,&y,&z);
a[y][x]=a[x][y]=z;//无向图,双向边
}
prim();
for(int i=2;i<=n;i++)
ans+=dist[i];//累加权值
printf("%d",ans);
return 0;
}
上面代码中用标记的方法解决了S,T两个集合的处理问题。
dist数组作用类似Dijstra中使用的dist数组,但是这里的dist数组的作用又有所不同:若节点属于集合S,则该节点的dist值就是该节点与集合T中的节点之间长度最小的边的长度。若节点属于集合T,则该节点的dist值就是该节点被加入T集合时选出的最小边的长度。
emmm,结束。