一、介绍
Kruskal算法是一种用来查找最小生成树的算法,由Joseph Kruskal在1956年发表。用来解决同样问题的还有Prim算法和Boruvka算法等。三种算法都是贪心算法的应用。和Boruvka算法不同的地方是,Kruskal算法在图中存在相同权值的边时也有效。
- 基本思想:按照权值从小到大的顺序选择n-1条边,并保证这n-1条边不构成回路
- 具体做法:首先构造一个只含n个顶点的森林,然后依权值从小到大从连通网中选择边加入到森林中,并使森林中不产生回路,直至森林变成一棵树为止
二、应用场景-公交站问题
- 有北京有新增7个站点(A, B, C, D, E, F, G) ,现在需要修路把7个站点连通
- 各个站点的距离用边线表示(权) ,比如 A – B 距离 12公里
- 问:如何修路保证各个站点都能连通,并且总的修建公路总里程最短?
三、图解分析
1.算法图解
在含有n个顶点的连通图中选择n-1条边,构成一棵极小连通子图,并使该连通子图中n-1条边上权值之和达到最小,则称其为连通网的最小生成树。
例如,对于如上图G4所示的连通网可以有多棵权值总和不相同的生成树。
假设,用数组R保存最小生成树结果
第1步:将边<E,F>加入R中。
边<E,F>的权值最小,因此将它加入到最小生成树结果R中。
第2步:将边<C,D>加入R中。
上一步操作之后,边<C,D>的权值最小,因此将它加入到最小生成树结果R中。
第3步:将边<D,E>加入R中。
上一步操作之后,边<D,E>的权值最小,因此将它加入到最小生成树结果R中。
第4步:将边<B,F>加入R中。
上一步操作之后,边<C,E>的权值最小,但<C,E>会和已有的边构成回路;因此,跳过边<C,E>。同理,跳过边<C,F>。将边<B,F>加入到最小生成树结果R中。
第5步:将边<E,G>加入R中。
上一步操作之后,边<E,G>的权值最小,因此将它加入到最小生成树结果R中。
第6步:将边<A,B>加入R中。
上一步操作之后,边<F,G>的权值最小,但<F,G>会和已有的边构成回路;因此,跳过边<F,G>。同理,跳过边<B,C>。将边<A,B>加入到最小生成树结果R中。
- 此时,最小生成树构造完成!它包括的边依次是:<E,F> <C,D> <D,E> <B,F> <E,G> <A,B>。
2.算法分析
根据前面介绍的克鲁斯卡尔算法的基本思想和做法,我们能够了解到,克鲁斯卡尔算法重点需要解决的以下两个问题:
- 问题一 对图的所有边按照权值大小进行排序。
- 问题二 将边添加到最小生成树中时,怎么样判断是否形成了回路。
问题一很好解决,采用排序算法进行排序即可。
问题二处理方式是:记录顶点在"最小生成树"中的终点,顶点的终点是"在最小生成树中与它连通的最大顶点"。然后每次需要将一条边添加到最小生存树时,判断该边的两个顶点的终点是否重合,重合的话则会构成回路。
3.如何判断是否构成回路
在将<E,F> <C,D> <D,E>加入到最小生成树R中之后,这几条边的顶点就都有了终点:
- C的终点是F。
- D的终点是F。
- E的终点是F。
- F的终点是F。
关于终点的说明:
- 就是将所有顶点按照从小到大的顺序排列好之后;某个顶点的终点就是"与它连通的最大顶点"。
- 因此,接下来,虽然<C,E>是权值最小的边。但是C和E的终点都是F,即它们的终点相同,因此,将<C,E>加入最小生成树的话,会形成回路。这就是判断回路的方式。也就是说,我们加入的边的两个顶点不能都指向同一个终点,否则将构成回路。
四、代码实现
import java.util.Arrays;
public class KruskalCaseDemo {
public static void main(String[] args) {
final int INF = Integer.MAX_VALUE;
//地点名称
char[] vertexs = {'A', 'B', 'C', 'D', 'E', 'F', 'G'};
//邻接矩阵
int matrix[][] = {
{0 , 12 , INF, INF, INF, 16 , 14},
{12 , 0 , 10 , INF, INF, 7 , INF},
{INF, 10 , 0 , 3 , 5 , 6 , INF},
{INF, INF, 3 , 0 , 4 , INF, INF},
{INF, INF, 5 , 4 , 0 , 2 , 8},
{16 , 7 , 6 , INF, 2 , 0 , 9},
{14 , INF, INF, INF, 8 , 9 , 0},
};
KruskalCase kc = new KruskalCase(vertexs, matrix);
kc.printMatrix();
kc.kruskal();
kc.showResult();
}
}
class KruskalCase {
//边的数量
private int edgeNum;
//顶点数组
private char[] vertexs;
//邻接矩阵
private int[][] matrix;
//使用INF表示两个顶点不能连通
private static final int INF = Integer.MAX_VALUE;
//最后结果数组的索引
int resultIndex = 0;
//创建结果数组,保存最后的最小生成树
EdgeData[] results = null;
public KruskalCase(char[] vertexs, int[][] matrix) {
this.vertexs = vertexs;
this.matrix = matrix;
//初始化顶点数和边的个数
// int vlen = vertexs.length;
// //初始化顶点
// this.vertexs = new char[vlen];
// for(int i = 0;i < vertexs.length;i++){
// this.vertexs[i] = vertexs[i];
// }
// this.matrix = new int[vlen][vlen];
// for (int i = 0; i < vlen; i++) {
// for (int j = 0; j < vlen; j++) {
// this.matrix[i][j] = matrix[i][j];
// }
// }
//统计边的条数
for (int i = 0; i < vertexs.length; i++) {
for (int j = i + 1; j < vertexs.length; j++) {
if (this.matrix[i][j] != INF) {
edgeNum++;
}
}
}
}
/**
* 打印邻接矩阵
*/
public void printMatrix() {
System.out.println("---------邻接矩阵---------");
for (int i = 0; i < vertexs.length; i++) {
for (int j = 0; j < vertexs.length; j++) {
System.out.printf("%12d", matrix[i][j]);
}
System.out.println();
}
System.out.println("---------邻接矩阵---------");
}
/**
* 显示结果
*/
public void showResult() {
System.out.println("---------输出结果---------");
for (int i = 0; i < results.length; i++) {
if(results[i] != null){
System.out.println(results[i]);
}
}
System.out.println("---------输出结果---------");
}
/**
* 一句边的权值 对边进行冒泡排序
*
* @param edgeData 边的集合
*/
public void sortEdges(EdgeData[] edgeData) {
for (int i = 0; i < edgeData.length - 1; i++) {
for (int j = 0; j < edgeData.length - 1 - i; j++) {
//下一条边的权值 > 当前边的权值 是进行交换
if (edgeData[j].weight > edgeData[j + 1].weight) {
EdgeData temp = edgeData[j];
edgeData[j] = edgeData[j + 1];
edgeData[j + 1] = temp;
}
}
}
}
/**
* 根据顶点的值查找顶点的下标
*
* @param c 顶点的值
* @return 顶点的下标, 未找到则返回-1
*/
private int getPosition(char c) {
for (int i = 0; i < vertexs.length; i++) {
if (vertexs[i] == c) {
return i;
}
}
return -1;
}
/**
* 将matrix中所有边放入Edge数组并返回
*
* @return 所有边
*/
private EdgeData[] getEdges() {
int index = 0;
EdgeData[] edgeData = new EdgeData[edgeNum];
for (int i = 0; i < vertexs.length; i++) {
for (int j = i + 1; j < vertexs.length; j++) {
if (matrix[i][j] != INF) {
edgeData[index++] = new EdgeData(vertexs[i], vertexs[j], matrix[i][j]);
}
}
}
return edgeData;
}
/**
* 根据顶点下标返回终点下标
* 用于判断两个顶点的终点是否相同
*
* @param ends 记录各个顶点对应的终点
* @param i 顶点的下标
* @return 顶点的终点的下标
*/
private int getEndIndexByStartIndex(int[] ends, int i) {
while (ends[i] != 0) {
i = ends[i];
}
return i;
}
/**
* 克鲁斯卡尔算法
*/
public void kruskal() {
//保存'已有最小生成树' 中的每个顶点在最小生成树中的终点
int[] ends = new int[edgeNum];
//获取图中所有边的集合
EdgeData[] edges = getEdges();
// System.out.println("图中边的集合=" + Arrays.toString(edges) + " 共:" + edges.length);
//按照边的权值大小排序
sortEdges(edges);
//初始化结果集
results = new EdgeData[edgeNum];
//遍历edges数组,判断带加入的边是否形成回路,形成回路不可加入,
// 未形成回路将其加入到结果数组result中
for (int i = 0; i < edgeNum; i++) {
//获取第i条边的第一个顶点
int peakIndex1 = getPosition(edges[i].start);
//获取第i条边的第二个顶点
int peakIndex2 = getPosition(edges[i].end);
//获取 peakIndex1 在已有最小生成树的终点
int endIndex1 = getEndIndexByStartIndex(ends, peakIndex1);
//获取 peakIndex2 在已有最小生成树的终点
int endIndex2 = getEndIndexByStartIndex(ends, peakIndex2);
//判断是否构成回路
if (endIndex1 != endIndex2) {
//设置endIndex1 在'已有最小生成树' 中的终点
ends[endIndex1] = endIndex2;
results[resultIndex++] = edges[i];
}
}
}
}
/**
* 一条边
*/
class EdgeData {
//边的第一个点
char start;
//边的第二个点
char end;
//边的权值
int weight;
public EdgeData(char start, char end, int weight) {
this.start = start;
this.end = end;
this.weight = weight;
}
@Override
public String toString() {
return "EdgeData{" + start + " -> " + end + ", weight=" + weight + '}';
}
}