本章目录
第14章 程序员常用的10中算法
14.1 二分查找算法(非递归)
14.1.1 二分查找算法(非递归)介绍
- 前面我们讲过了二分查找算法,是使用递归的方式,下面我们讲解二分查找算法的非递归方式
- 二分查找法只适用于从有序的数列中进行查找(比如数字和字母等),将数列排序后再进行查找
- 二分查找法的运行时间为对数时间O(㏒₂n) ,即查找到需要的目标位置最多只需要㏒₂n 步,假设从[0,99]的队列(100 个数,即 n=100)中寻到目标数 30,则需要查找步数为㏒₂100 , 即最多需要查找 7 次( 2^6 < 100 < 2^7)
public static int binarysearch(int[] arr, int target) {
int left = 0;
int right = arr.length-1;
while (left < right) {
int mid = (left + right )/2;
if (arr[mid] == target) {
return mid;
}else if (arr[mid] > target) {
right = mid -1 ;
}else {
left = mid + 1;
}
}
return -1;
}
14.2 分治算法
14.2.1 分治算法介绍
- 分治法是一种很重要的算法。字面上的解释是**“分而治之”,就是把一个复杂的问题分成两个或更多的相同或相似的子问题**,再把子问题分成更小的子问题……直到最后子问题可以简单的直接求解,原问题的解即子问题的解的合并。这个技巧是很多高效算法的基础,如排序算法(快速排序,归并排序),傅立叶变换(快速傅立叶变 换)……
- 分治算法可以求解的一些经典问题
(1)二分搜索
(2)大整数乘法
(3)棋盘覆盖
(4)合并排序
(5) 快速排序
(6)线性时间选择
(7)最接近点对问题
(8)循环赛日程表
(9) 汉诺塔 - 分治算法的基本步骤
分治法在每一层递归上都有三个步骤:
(1)分解:将原问题分解为若干个规模较小,相互独立,与原问题形式相同的子问题
(2)解决:若子问题规模较小而容易被解决则直接解,否则递归地解各个子问题
(3)合并:将各个子问题的解合并为原问题的解。 - 分治(Divide-and-Conquer§)算法设计模式如下:
14.2.2 分治算法最佳实践-汉诺塔
- 思路分析
(1)如果是有一个盘, A->C
如果我们有 n >= 2 情况,我们总是可以看做是两个盘 :1.最下边的盘 2. 上面的所有盘看做是一个盘。
(2)先把 最上面的盘 A->B
(3) 把最下边的盘 A->C
(4)把 B 塔的所有盘 从 B->C - 代码实现
/**
* 汉诺塔的移动方法——使用分治算法
* @param num:汉诺塔盘的数目
* @param a
* @param b
* @param c
*/
public static void hanoiTower(int num, char a, char b, char c) {
//如果只有一个盘
if (num == 1) {
System.out.println("第1个盘从 "+a+"到"+c);
}else {
//如果我们有n>=2个盘,我们总是可以看做是两个盘:1个最下面的盘,1个上面所有的盘看做是一个盘
//1. 先将最上面的所有盘A-B,移动过程会使用到C
hanoiTower(num-1, a, c, b);
//2. 将最下面的盘A-C
System.out.println("第"+num +"个盘从 "+a+"到"+c);
//3. 把B塔的所有盘从B-C,移动过程中使用a塔
hanoiTower(num-1, b, a, c);
}
}
14.3 动态规划算法
14.3.1 应用场景-背包问题
- 背包问题:有一个背包,容量为 4 磅 , 现有如下物品
(1)要求达到的目标为装入的背包的总价值最大,并且重量不超出
(2) 要求装入的物品不能重复
14.3.2 动态规划算法介绍
- 动态规划(Dynamic Programming)算法的核心思想是:将大问题划分为小问题进行解决,从而一步步获取最优解的处理算法
- 动态规划算法与分治算法类似,其基本思想也是将待求解问题分解成若干个子问题,先求解子问题,然后从这些子问题的解得到原问题的解。
- 与分治法不同的是,适合于用动态规划求解的问题,经分解得到子问题往往不是互相独立的。 ( 即下一个子阶段的求解是建立在上一个子阶段的解的基础上,进行进一步的求解 )
- 动态规划可以通过填表的方式来逐步推进,得到最优解.
14.3.3 动态规划算法最佳实践-背包问题
- 说明
(1)背包问题主要是指一个给定容量的背包、若干具有一定价值和重量的物品,如何选择物品放入背包使物品的价值最大。其中又分 01 背包和完全背包(完全背包指的是:每种物品都有无限件可用)
(2)这里的问题属于 01 背包,即每个物品最多放一个。而无限背包可以转化为01 背包。 - 算法的主要思想
利用动态规划来解决。每次遍历到的第 i 个物品,根据 w[i]和 v[i]来确定是否需要将该物品 放入背包中。即对于给定的 n 个物品,设 v[i]、w[i]分别为第 i 个物品的价值和重量,C 为背包的容量。再令 v[i][j] 表示在前 i 个物品中能够装入容量为 j 的背包中的最大价值。则我们有下面的结果:
(1)当v[i][0]=v[0][j]=0; //表示 填入表 第一行和第一列是0
(2)当 w[i]> j 时:v[i][j]=v[i-1][j] // 当准备加入新增的商品的容量大于当前背包的容量时(即超出了背包的容量),就直接使用上一个单元格的装入策略(不装入背包)
(3)当 j>=w[i]时: v[i][j]=max{v[i-1][j], v[i]+v[i-1][j-w[i]]},//当 准备加入的新增的商品的容量小于等于当前背包的容量,
PS:
v[i-1][j]: 就是上一个单元格的装入的最大值
v[i] : 表示当前商品的价值
v[i-1][j-w[i]] : 装入 i-1 商品,到剩余空间 j-w[i]的最大值
3. 代码实现
package com.atguigu.dynamic;
public class KnapsackProblem {
public static void main(String[] args) {
int[] w = {1,4,3}; //物品的重量
int[] val = {1500, 3000,2000}; //物品的价值
int m = 4; //背包的容量
int n = val.length; //物品的数量
//创建二维数组;v[i][j]表示在前i个物品中能够装入容量为j的背包中的最大价值
int[][] v = new int[n+1][m+1] ; //因为在本算法中会多一行和一列的0值
int[][] path = new int[n+1][m+1]; //记录放入商品的情况
//初始化第一行和第一列为零
for (int i = 0; i < v.length; i++) {
v[i][0] = 0;
}
for (int i = 0; i < v[0].length; i++) {
v[0][i] = 0 ;
}
//依据公式实现动态规划处理
for (int i = 1; i < v.length; i++) {
for (int j = 1; j < v[0].length; j++) {
//公式
if (w[i-1] > j) { //因为这里的i从1开始,而w的i从0开始,因此需要减1
v[i][j] = v[i-1][j]; //
}else { //同上
//v[i][j] = Math.max(v[i-1][j], val[i-1] + v[i-1][j-w[i-1]]);
//为了记录商品存放到背包的情况,不能直接使用上面的公式,需要使用if-else的结构间接实现
if (v[i-1][j] < val[i-1] + v[i-1][j-w[i-1]]) {
v[i][j] = val[i-1] + v[i-1][j-w[i-1]];
path[i][j] = 1;
}else {
v[i][j] = v[i-1][j];
}
}
}
}
//显示矩阵
for (int i = 0; i < v.length; i++) {
for (int j = 0; j < v[i].length; j++) {
System.out.print(v[i][j] + " ");
}
System.out.println();
}
/*//输出最后我们放入的哪些物品
//这样输出有冗余数据,其实我们只需要最后的放入
for (int i = 0; i < path.length; i++) {
for (int j = 0; j < path[i].length; j++) {
if (path[i][j] == 1) {
System.out.printf("第%d个商品放入到背包\n", i);
}
}
}*/
for (int i = 0; i < v.length; i++) {
for (int j = 0; j < v[i].length; j++) {
System.out.print(path[i][j] + " ");
}
System.out.println();
}
int i = path.length -1; //行的最大下标
int j = path[0].length -1; //列的最大下标
while (i > 0 && j > 0) { //从path的最后开始找
if (path[i][j] == 1) {
System.out.printf("第%d个商品放入到背包\n", i);
j -= w[i-1];
}
i--;
}
}
}
14.4 KMP算法
14.4.1 应用场景-字符串匹配问题
- 字符串匹配问题:
(1)有一个字符串 str1= ““硅硅谷 尚硅谷你尚硅 尚硅谷你尚硅谷你尚硅你好””,和一个子串 str2=“尚硅谷你尚硅你”
(2)现在要判断 str1 是否含有 str2, 如果存在,就返回第一次出现的位置, 如果没有,则返回-1
14.4.2 暴力匹配
- 思路
(1)如果当前字符匹配成功(即 str1[i] == str2[j]),则 i++,j++,继续匹配下一个字符
(2)如果失配(即 str1[i]! = str2[j]),令 i = i - (j - 1),j = 0。相当于每次匹配失败时,i 回溯,j 被置为0。
(3)用暴力方法解决的话就会有大量的回溯,每次只移动一位,若是不匹配,移动到下一位接着判断,浪费了大量的时间。(不可行!) - 实现
package com.atguigu.kmp;
public class ViolenceMatch {
public static void main(String[] args) {
String str1 = "硅硅谷 尚硅谷你尚硅 尚硅谷你尚硅谷你尚硅你好";
String str2 = "尚硅谷你尚硅你";
int index = violenceMatch(str1, str2);
System.out.println(index);
}
//暴力匹配算法
public static int violenceMatch(String str1, String str2) {
char[] s1 = str1.toCharArray();
char[] s2 = str2.toCharArray();
int s1Len = s1.length;
int s2Len = s2.length;
int i = 0; //i索引指向s1
int j = 0; //j索引指向s2
while (i < s1Len && j < s2Len) {
if (s1[i] == s2[j]) {
i++;
j++;
}else { //如果匹配失败,令i=i-j+1,j=0
i = i-j+1;
j = 0;
}
}
//判断是否匹配成功
if (j == s2Len) {
return i -j ;
}else {
return -1;
}
}
}
14.4.3 KMP 算法介绍
- KMP 是一个解决模式串在文本串是否出现过,如果出现过,最早出现的位置的经典算法
- Knuth-Morris-Pratt 字符串查找算法,简称为 “KMP 算法”,常用于在一个文本串 S 内查找一个模式串 P 的出现位置,这个算法由 Donald Knuth、Vaughan Pratt、James H. Morris 三人于 1977 年联合发表,故取这 3 人的 姓氏命名此算法.
- KMP 方法算法就利用之前判断过信息,通过一个 next 数组,保存模式串中前后最长公共子序列的长度,每次 回溯时,通过 next 数组找到,前面匹配过的位置,省去了大量的计算时间
- 参考资料:https://www.cnblogs.com/ZuoAndFutureGirl/p/9028287.html
14.4.4 KMP 算法最佳应用-字符串匹配问题
-
字符串匹配问题::
(1)有一个字符串 str1= “BBC ABCDAB ABCDABCDABDE”,和一个子串 str2=“ABCDABD”
(2)现在要判断 str1 是否含有 str2, 如果存在,就返回第一次出现的位置, 如果没有,则返回-1 3) 要求:使用 KMP 算法完成判断,不能使用简单的暴力匹配算法.
1.首先,用 Str1 的第一个字符和 Str2 的第一个字符去比较,不符合,关键词向后移动一位
-
重复第一步,还是不符合,再后移
-
一直重复,直到 Str1 有一个字符与 Str2 的第一个字符符合为止
-
接着比较字符串和搜索词的下一个字符,还是符合。
5.遇到 Str1 有一个字符与 Str2 对应的字符不符合。
6.这时候,想到的是继续遍历 Str1 的下一个字符,重复第 1 步。(其实是很不明智的,因为此时BCD 已经比较过了, 没有必要再做重复的工作,一个基本事实是,当空格与 D 不匹配时,你其实知道前面六个字符是”ABCDAB”。 KMP 算法的想法是,设法利用这个已知信息,不要把”搜索位置”移回已经比较过的位置,继续把它向后移,这 样就提高了效率。)
7.怎么做到把刚刚重复的步骤省略掉?可以对 Str2 计算出一张《部分匹配表》,这张表的产生在后面介绍
8.已知空格与 D 不匹配时,前面六个字符”ABCDAB”是匹配的。查表可知,最后一个匹配字符 B 对应的”部分 匹配值”为 2,因此按照下面的公式算出向后移动的位数:
移动位数 = 已匹配的字符数 - 对应的部分匹配值
因为 6 - 2 等于 4,所以将搜索词向后移动 4 位。
9.因为空格与C不匹配,搜索词还要继续往后移。这时,已匹配的字符数为2(”AB”),对应的”部分匹配值” 为 0。所以,移动位数 = 2 - 0,结果为 2,于是将搜索词向后移 2 位。
10.因为空格与 A 不匹配,继续后移一位。
11.逐位比较,直到发现 C 与 D 不匹配。于是,移动位数 = 6 - 2,继续将搜索词向后移动 4 位。
12.逐位比较,直到搜索词的最后一位,发现完全匹配,于是搜索完成。如果还要继续搜索(即找出全部匹配), 移动位数 = 7 - 0,再将搜索词向后移动 7 位,这里就不再重复了。
13.介绍《部分匹配表》怎么产生的 先介绍前缀,后缀是什么
“部分匹配值”就是**”前缀”和”后缀”的最长的共有元素的长度**。以”ABCDABD”为例,
-”A”的前缀和后缀都为空集,共有元素的长度为 0;
-”AB”的前缀为[A],后缀为[B],共有元素的长度为0;
-”ABC”的前缀为[A, AB],后缀为[BC, C],共有元素的长度0;
-”ABCD”的前缀为[A, AB, ABC],后缀为[BCD, CD, D],共有元素的长度为0;
-”ABCDA”的前缀为[A, AB, ABC, ABCD],后缀为[BCDA, CDA, DA, A],共有元素为”A”,长度为1; -”ABCDAB”的前缀为[A, AB, ABC, ABCD, ABCDA],后缀为[BCDAB, CDAB, DAB, AB, B],共有元素为”AB”, 长度为 2;
-”ABCDABD”的前缀为[A, AB, ABC, ABCD, ABCDA, ABCDAB],后缀为[BCDABD, CDABD, DABD, ABD, BD, D],共有元素的长度为 0。
14.”部分匹配”的实质是,有时候,字符串头部和尾部会有重复。比如,”ABCDAB”之中有两个”AB”,那么 它的”部分匹配值”就是 2(”AB”的长度)。搜索词移动的时候,第一个”AB”向后移动 4 位(字符串长度-部分匹配值),就可以来到第二个”AB”的位置。
代码实现
package com.atguigu.kmp;
import java.util.Arrays;
public class kmpAlgorithm {
public static void main(String[] args) {
String str1 = "BBC ABCDAB ABCDABCDABDE";
String str2 = "ABCDABD";
int[] next = kmpNext("ABCDABD");
System.out.println(Arrays.toString(next));
int index = kmpSearch(str1, str2, next);
System.err.println(index);
}
/**
* kmp算法
* @param str1
* @param str2
* @param next:部分匹配表
* @return
*/
public static int kmpSearch(String str1, String str2, int[] next) {
//遍历
for (int i = 0,j = 0; i < str1.length(); i++) {
//需要处理str1.charAt(i) != str2.charAt(j)
//kmp算法核心点
while(j > 0 && str1.charAt(i) != str2.charAt(j)) {
j=next[j-1];
}
if (str1.charAt(i) == str2.charAt(j)) {
j++;
}
if (j == str2.length()) {
return i-j+1;
}
}
return -1;
}
//获取一个字符串(子串)的部分匹配值表
public static int[] kmpNext(String dest) {
//创建一个next数组保存部分匹配值
int[] next = new int[dest.length()];
next[0] = 0; //如果字符串的长度是1,则部分匹配值就是0.
for (int i = 1, j = 0; i < dest.length(); i++) {
//当dest.charAt(i) != dest.charAt(j),我们需要从next[j-1]获取新的j
//知道我们发现dest.charAt(i) == dest.charAt(j)才退出
while (j > 0 && dest.charAt(i) != dest.charAt(j)) {
j = next[j-1];
}
//当dest.charAt(i) == dest.charAt(j)满足时,部分匹配值就是1
//charAt()方法返回指定索引位置的char值。索引范围为0~length()-1
//此处并不甚明白
if (dest.charAt(i) == dest.charAt(j)) {
j++;
}
next[i] = j;
}
return next;
}
}
14.5 贪心算法
14.5.1 应用场景-集合覆盖问题
假设存在下面需要付费的广播台,以及广播台信号可以覆盖的地区。 如何选择最少的广播台,让所有的地区 都可以接收到信号
14.5.2 贪心算法介绍
- 贪婪算法(贪心算法)是指在对问题进行求解时,在每一步选择中都采取最好或者最优(即最有利)的选择,从而希望能够导致结果是最好或者最优的算法
- 贪婪算法所得到的结果不一定是最优的结果(有时候会是最优解),但是都是相对近似(接近)最优解的结果
- 使用贪婪算法,效率高:
- 思路分析:
如何找出覆盖所有地区的广播台的集合呢,使用穷举法实现,列出每个可能的广播台的集合,这被称为幂集。假设总的有 n 个广播台,则广播台的组合总共有 2ⁿ -1 个,假设每秒可以计算 10 个子集, 如图:
(1)目前并没有算法可以快速计算得到准备的值, 使用贪婪算法,则可以得到非常接近的解,并且效率高。选择策略上,因为需要覆盖全部地区的最小集合:
(2)遍历所有的广播电台, 找到一个覆盖了最多未覆盖的地区的电台(此电台可能包含一些已覆盖的地区,但没有关系)
(3)将这个电台加入到一个集合中(比如 ArrayList), 想办法把该电台覆盖的地区在下次比较时去掉。
(4)重复第 1 步直到覆盖了全部的地区
- 代码实现
package com.atguigu.greedy;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.HashSet;
public class GreedyAlgorithm {
public static void main(String[] args) {
//创建广播电台,放入到Map
HashMap<String, HashSet<String>> broadcasts = new HashMap<String, HashSet<String> >();
HashSet<String> hashSet1 = new HashSet<String>();
hashSet1.add("北京"); hashSet1.add("上海"); hashSet1.add("天津");
HashSet<String> hashSet2 = new HashSet<String>();
hashSet2.add("广州"); hashSet2.add("北京"); hashSet2.add("深圳");
HashSet<String> hashSet3 = new HashSet<String>();
hashSet3.add("成都"); hashSet3.add("上海"); hashSet3.add("杭州");
HashSet<String> hashSet4 = new HashSet<String>();
hashSet4.add("上海"); hashSet4.add("天津");
HashSet<String> hashSet5 = new HashSet<String>();
hashSet5.add("杭州"); hashSet5.add("大连");
//加入到map
broadcasts.put("k1", hashSet1);
broadcasts.put("k2", hashSet2);
broadcasts.put("k3", hashSet3);
broadcasts.put("k4", hashSet4);
broadcasts.put("k5", hashSet5);
//添加地点
HashSet<String> allAreas = new HashSet<String>();
allAreas.add("北京");
allAreas.add("上海");
allAreas.add("天津");
allAreas.add("广州");
allAreas.add("深圳");
allAreas.add("成都");
allAreas.add("杭州");
allAreas.add("大连");
System.out.println(allAreas);
//创建一个ArrayList,存放选择的电台集合
ArrayList<String> selects = new ArrayList<String>();
//定义一个临时的集合,在遍历过程中,存放遍历过程层中的电台覆盖的地区和 当前还未覆盖的地区的交集
HashSet<String> tempSet = new HashSet<String>();
//定义给maxKey,保存在一次遍历过程中,能够覆盖最大覆盖范围的电台对应的key,
//如果maxKey不为null,则会加入到selects。
String maxKey = null;
while (allAreas.size() != 0) { //表示还有未覆盖的地区
//每进行一次,都需要
maxKey = null;
//遍历boradcasts,取出对应的key
for (String key : broadcasts.keySet()) {
tempSet.clear();
//当前这个key能够覆盖的范围
HashSet<String> areas = broadcasts.get(key);
tempSet.addAll(areas);
//求出tempSet 和 allAreas 集合的交集,交集会赋给tempSet
tempSet.retainAll(allAreas);
//如果当前这个集合包含的未覆盖区域的数量,比maxKey指向的集合区域还多
//(maxKey == null || tempSet.size() > broadcasts.get(maxKey).size()) 体现贪心算法。
if (tempSet.size() > 0 && (maxKey == null || tempSet.size() > broadcasts.get(maxKey).size())) {
maxKey = key;
}
}
//maxKey
if (maxKey != null) {
selects.add(maxKey);
//将maxKey指向的广播电台覆盖区域从allAreas 去掉
allAreas.removeAll(broadcasts.get(maxKey));
}
}
System.out.println(selects);
}
}
14.6 普利姆算法
14.6.1 应用场景-修路问题
- 修路问题
(1)有胜利乡有7 个村庄(A, B, C, D, E, F, G) ,现在需要修路把 7 个村庄连通
(2)各个村庄的距离用边线表示(权) ,比如 A – B 距离 5 公里
(3)问:如何修路保证各个村庄都能连通,并且总的修建公路总里程最短? - 思路
将 10 条边,连接即可,但是总的里程数不是最小.
正确的思路,就是尽可能的选择少的路线,并且每条路线最小,保证总里程数最少.
14.6.2 最小生成树
- 修路问题本质就是就是最小生成树问题, 先介绍一下最小生成树(Minimum Cost Spanning Tree),简称 MST。 给定一个带权的无向连通图,如何选取一棵生成树,使树上所有边上权的总和为最小,这叫最小生成树
(1)N 个顶点,一定有 N-1 条边
(2)包含全部顶点
(3)N-1 条边都在图中 - 求最小生成树的算法主要是普里姆算法和克鲁斯卡尔算法。
14.6.3 普里姆算法介绍
- 普利姆(Prim)算法求最小生成树,也就是在包含 n 个顶点的连通图中,找出只有(n-1)条边包含所有 n 个顶点的连通子图,也就是所谓的极小连通子图
- 普利姆的算法如下:
(1)设 G=(V,E)是连通网,T=(U,D)是最小生成树,V,U 是顶点集合,E,D 是边的集合
(2)若从顶点 u 开始构造最小生成树,则从集合 V 中取出顶点 u 放入集合 U 中,标记顶点v 的visited[u]=1
(3)若集合 U 中顶点 ui 与集合 V-U 中的顶点 vj 之间存在边,则寻找这些边中权值最小的边,但不能构成回路,将
顶点 vj 加入集合 U 中,将边(ui,vj)加入集合 D 中,标记 visited[vj]=1
(4)重复步骤②,直到 U 与 V 相等,即所有顶点都被标记为访问过,此时D 中有 n-1 条边
(5) 提示: 单独看步骤很难理解,我们通过代码来讲解,比较好理解. - 图解普利姆算法
14.6.4 代码实现
package com.atguigu.prim;
import java.util.Arrays;
public class PrimAlgorithm {
public static void main(String[] args) {
char[] data = new char[] {'A','B','C','D','E','F','G'};
int verxs = data.length;
int[][] weight = new int[][] {
{10000,5,7,10000,10000,10000,2},
{5,10000,10000,9,10000,10000,3},
{7,10000,10000,10000,8,10000,10000},
{10000,9,10000,10000,10000,4,10000},
{10000,10000,8,10000,10000,5,4},
{10000,10000,10000,4,5,10000,6},
{2,3,10000,10000,4,6,10000}
};
MGraph graph = new MGraph(verxs);
MinTree minTree = new MinTree();
minTree.createGraph(graph, verxs, data, weight);;
//minTree.showGraph(graph);
minTree.prim(graph, 0);
}
}
//创建最小生成树
class MinTree{
/**
* 创建图的邻接矩阵
* @param graph:图对象
* @param verxs:图对应的顶点个数
* @param data:图的各顶点的值
* @param weight:图的邻接矩阵
*/
public void createGraph(MGraph graph, int verxs, char data[], int[][] weight) {
for (int i = 0; i < verxs; i ++) {
graph.data[i] = data[i];
for (int j = 0; j < verxs; j++) {
graph.weight[i][j] = weight[i][j];
}
}
}
//显示图
public void showGraph(MGraph graph) {
for (int[] link : graph.weight) {
System.out.println(Arrays.toString(link));
}
}
/**
* prim算法,得到最小生成树
* @param graph
* @param v :表示从第几个顶点开始生成最小树。
*/
public void prim(MGraph graph, int v) {
//标记节点是否被访问
int visited[] = new int[graph.verxs];
//将当前节点标记为已访问
visited[v] = 1;
int h1 = -1; //标记两个顶点的下标
int h2 = -1;
int minWeight = 10000; //将minWeight初始化成一个大的值,后面遍历的过程中,会被替换
for (int k = 1; k < graph.verxs; k++) { //第一个节点是不用使用prim算法的
//确定每一次生成的子图,和哪个节点的距离最近
for (int i = 0; i < graph.verxs; i++) { //所有访问过的节点
for (int j = 0; j < graph.verxs; j++) { //所有没有访问过的节点
if (visited[i] ==1 && visited[j] == 0 && graph.weight[i][j] < minWeight) {
minWeight = graph.weight[i][j];
h1 = i ;
h2 = j;
}
}
}
//找到一条最小边
System.out.println("边<"+graph.data[h1]+","+graph.data[h2]+">权值:"+minWeight);
visited[h2] = 1;
minWeight = 10000;
}
}
}
class MGraph{
int verxs; //表示图的节点个数
char[] data ; //存放节点数据
int[][] weight; //存放边,就是邻接矩阵
public MGraph(int verxs) {
this.verxs = verxs;
data = new char[verxs];
weight = new int[verxs][verxs];
}
}
14.7 克鲁斯卡尔算法
14.7.1 应用场景-公交站问题
- 某城市新增 7 个站点(A, B, C, D, E, F, G) ,现在需要修路把7 个站点连通
- 各个站点的距离用边线表示(权) ,比如 A – B 距离 12 公里
- 问:如何修路保证各个站点都能连通,并且总的修建公路总里程最短?
14.7.2 克鲁斯卡尔算法介绍
(1) 克鲁斯卡尔(Kruskal)算法,是用来求加权连通图的最小生成树的算法。
(2)基本思想:按照权值从小到大的顺序选择 n-1 条边,并保证这n-1 条边不构成回路
(3)具体做法:首先构造一个只含 n 个顶点的森林,然后依权值从小到大从连通网中选择边加入到森林中,并使森林中不产生回路,直至森林变成一棵树为止
14.7.3 克鲁斯卡尔算法图解说明
第 1 步:将边<E,F>加入 R 中。
边<E,F>的权值最小,因此将它加入到最小生成树结果 R 中。
第 2 步:将边<C,D>加入 R 中。
上一步操作之后,边<C,D>的权值最小,因此将它加入到最小生成树结果 R 中。
第 3 步:将边<D,E>加入 R 中。
上一步操作之后,边<D,E>的权值最小,因此将它加入到最小生成树结果 R 中。
第 4 步:将边<B,F>加入 R 中。
上一步操作之后,边<C,E>的权值最小,但<C,E>会和已有的边构成回路;因此,跳过边<C,E>。同理,跳
过边<C,F>。将边<B,F>加入到最小生成树结果 R 中。
第 5 步:将边<E,G>加入 R 中。
上一步操作之后,边<E,G>的权值最小,因此将它加入到最小生成树结果 R 中。
第 6 步:将边<A,B>加入 R 中。
上一步操作之后,边<F,G>的权值最小,但<F,G>会和已有的边构成回路;因此,跳过边<F,G>。同理,跳 过边<B,C>。将边<A,B>加入到最小生成树结果 R 中。
此时,最小生成树构造完成!它包括的边依次是:<E,F> <C,D> <D,E> <B,F> <E,G> <A,B>。
14.7.3 克鲁斯卡尔算法分析
- 克鲁斯卡尔算法的关键问题
根据前面介绍的克鲁斯卡尔算法的基本思想和做法,我们能够了解到,克鲁斯卡尔算法重点需要解决的以下两个问 题:
(1)问题一 对图的所有边按照权值大小进行排序。
(2)问题二 将边添加到最小生成树中时,怎么样判断是否形成了回路。
问题一很好解决,采用排序算法进行排序即可。
问题二,处理方式是:记录顶点在"最小生成树"中的终点,顶点的终点是"在最小生成树中与它连通的最大顶点"。 然后每次需要将一条边添加到最小生存树时,判断该边的两个顶点的终点是否重合,重合的话则会构成回路。
- 如何判断是否构成回路-举例说明(如图)
在将<E,F> <C,D> <D,E>加入到最小生成树 R 中之后,这几条边的顶点就都有了终点:
(01) C 的终点是 F。(02) D 的终点是 F。 (03) E 的终点是 F。 (04) F 的终点是 F。
PS:终点:将所有顶点按照从小到大的顺序排列好之后;某个顶点的终点就是"与它连通的最大顶点"。
虽然<C,E>是权值最小的边。但是C 和 E 的终点都是 F,即它们的终点相同,因此,将<C,E> 加入最小生成树的话,会形成回路。
因此,判断构成回路的依据:加入的边的两个顶点不能都指向同一 个终点,否则将构成回路。
14.7.4 克鲁斯卡尔算法的代码实现
package com.atguigu.kruskal;
import java.util.Arrays;
public class KruskalCase {
private int edgeNum; // 边的个数
private char[] vertexs; // 顶点个数
private int[][] matrix; // 邻接矩阵
private static final int INF = Integer.MAX_VALUE; // 表示两个顶点不能连通。
public static void main(String[] args) {
char[] vertexs = { 'A', 'B', 'C', 'D', 'E', 'F', 'G' };
int matrix[][] = {
/* A *//* B *//* C *//* D *//* E *//* F *//* G */
/* A */ { 0, 12, INF, INF, INF, 16, 14 }, /* B */ { 12, 0, 10, INF, INF, 7, INF },
/* C */ { INF, 10, 0, 3, 5, 6, INF }, /* D */ { INF, INF, 3, 0, 4, INF, INF },
/* E */ { INF, INF, 5, 4, 0, 2, 8 }, /* F */ { 16, 7, 6, INF, 2, 0, 9 },
/* G */ { 14, INF, INF, INF, 8, 9, 0 } };
KruskalCase kruskalCase = new KruskalCase(vertexs, matrix);
System.out.println();
/*
* EData[] edges = kruskalCase.getEdges();
* System.out.println("排序前"+Arrays.toString(edges));
* kruskalCase.sortEdges(edges);
* System.out.println("排序后"+Arrays.toString(edges));
*/
kruskalCase.kruskal();
}
// 构造器
public KruskalCase(char[] vertexs, int[][] matrix) {
// 初始化顶点数和边的个数
int vlen = vertexs.length;
// 初始化顶点,
this.vertexs = new char[vlen];
for (int i = 0; i < vertexs.length; i++) {
this.vertexs[i] = vertexs[i];
}
// 初始化边
this.matrix = new int[vlen][vlen];
for (int i = 0; i < vlen; i++) {
for (int j = 0; j < vlen; j++) {
this.matrix[i][j] = matrix[i][j];
}
}
// 统计边的条数
for (int i = 0; i < vlen; i++) {
for (int j = i + 1; j < vlen; j++) {
if (this.matrix[i][j] != INF) {
edgeNum++;
}
}
}
}
// 对边进行排序:冒泡排序
private void sortEdges(EData[] edges) {
for (int i = 0; i < edges.length - 1; i++) {
for (int j = 0; j < edges.length - 1 - i; j++) {
if (edges[j].weight > edges[j + 1].weight) {
EData temp = edges[j];
edges[j] = edges[j + 1];
edges[j + 1] = temp;
}
}
}
}
// 返回顶点对应的下标
private int getPosition(char ch) {
for (int i = 0; i < vertexs.length; i++) {
if (vertexs[i] == ch) {
return i;
}
}
return -1;
}
/**
* 获取图中的边,放到EData[]数组中,后面我们需要遍历该数组,是通过matrix邻接矩阵来获取 @return:EData[]
* 形式[['A','B',12],['B','F',7]……]
*/
private EData[] getEdges() {
int index = 0;
EData[] edges = new EData[edgeNum];
for (int i = 0; i < vertexs.length; i++) {
for (int j = i + 1; j < vertexs.length; j++) {
if (matrix[i][j] != INF) {
edges[index++] = new EData(vertexs[i], vertexs[j], matrix[i][j]);
}
}
}
return edges;
}
/**
* 获取下标为i的顶点的终点,用以判断两个顶点的终点是否构成回路
*
* @param ends:记录了各个顶点的终点是哪个;ends是在遍历的过程中逐步形成的
* @param i:传入的顶点对应的下标
* @return:返回的就是下标为i的顶点对应的终点的下标。
*/
private int getEnd(int[] ends, int i) {
while (ends[i] != 0) {
i = ends[i];
}
return i;
}
// 克鲁斯卡尔算法的代码实现
public void kruskal() {
int index = 0; // 表示最后结果数组的索引
int[] ends = new int[edgeNum]; // 用于保存“已有最小生成书“中的每个顶点在最小生成树中的终点
// 创建结果数组,保存最后的最小生成树
EData[] rets = new EData[edgeNum];
// 获取图中所有边的集合,一共12边
EData[] edges = getEdges();
System.out.println("图的边的集合" + Arrays.toString(edges) + "共" + edges.length); // 12
// 按照边的权值进行排序
sortEdges(edges);
// 遍历edges数组,将边添加到最小生成树中,判断是准备加入的边是否形成了回路,如果没有,就加入rets,否则不能加入
for (int i = 0; i < edgeNum; i++) {
// 获取第i条边的第一个顶点 和第二个顶点
int p1 = getPosition(edges[i].start);
int p2 = getPosition(edges[i].end);
// 获取p1及p2这个顶点在已有最小生成树中的终点
int m = getEnd(ends, p1); // m=4
int n = getEnd(ends, p2); // n=5
// 判断是否构成回路
if (m != n) { // 没有构成回路
ends[m] = n; // 设置m在已有最小生成树中的终点为n;即<E,F> [0,0,0,00,5,0,0,0,0,0,0,0]
rets[index++] = edges[i];
}
}
// 统计并打印“最小生成树”
System.out.println("最小生成树为:");
for (int i = 0; i < index; i++) {
System.out.println(rets[i]);
}
}
// 打印邻接矩阵
public void print() {
System.out.println("邻接矩阵为:");
for (int i = 0; i < vertexs.length; i++) {
for (int j = 0; j < vertexs.length; j++) {
System.out.printf("%12d", matrix[i][j]);
}
System.out.println();
}
}
}
// 创建一个EData,它的对象实例就是一条边
class EData {
char start; // 边的一个顶点
char end; // 边的另一个顶点
int weight; // 边的权值
public EData(char start, char end, int weight) {
this.start = start;
this.end = end;
this.weight = weight;
}
@Override
public String toString() {
return "EData [<" + start + "," + end + ">, weight=" + weight + "]";
}
}
14.8 迪杰斯特拉算法
14.8.1 应用场景-最短路径问题
- 战争时期,胜利乡有 7 个村庄(A, B, C, D, E, F, G) ,现在有六个邮差,从 G 点出发,需要分别把邮件分别送到 A, B, C , D, E, F 六个村庄
- 各个村庄的距离用边线表示(权) ,比如 A – B 距离 5 公里
- 问:如何计算出 G 村庄到 其它各个村庄的最短距离?
- 如果从其它点出发到各个点的最短距离又是多少?
14.8.2 迪杰斯特拉(Dijkstra)算法介绍
迪杰斯特拉(Dijkstra)算法是典型最短路径算法,用于计算一个结点到其他结点的最短路径。它的主要特点是以 起始点为中心向外层层扩展(广度优先搜索思想),直到扩展到终点为止。
14.8.3 迪杰斯特拉(Dijkstra)算法过程
- 设置出发顶点为 v,顶点集合 V{v1,v2,vi…},v 到 V 中各顶点的距离构成距离集合 Dis,Dis{d1,d2,di…},Dis 集合记录着 v 到图中各顶点的距离(到自身可以看作 0,v 到 vi 距离对应为 di)
- 从 Dis 中选择值最小的 di 并移出 Dis 集合,同时移出 V 集合中对应的顶点vi,此时的v 到vi 即为最短路径
- 更新 Dis 集合,更新规则为:比较 v 到 V 集合中顶点的距离值,与 v 通过 vi 到 V 集合中顶点的距离值,保留 值较小的一个(同时也应该更新顶点的前驱节点为 vi,表明是通过 vi 到达的)
- 重复执行两步骤,直到最短路径顶点为目标顶点即可结束
package com.atguigu.dijkstra;
import java.util.Arrays;
public class DijkstraAlogrithm {
public static void main(String[] args) {
char[] vertex = new char[] { 'A', 'B', 'C', 'D', 'E', 'F', 'G' };
final int N = 65535; // 表示不可连接
// 邻接矩阵
int[][] matrix = new int[][] { { N, 5, 7, N, N, N, 2 }, { 5, N, N, 9, N, N, 3 }, { 7, N, N, N, 8, N, N },
{ N, 9, N, N, N, 4, N }, { N, N, 8, N, N, 5, 4 }, { N, N, N, 4, 5, N, 6 }, { 2, 3, N, N, 4, 6, N } };
Graph graph = new Graph(vertex, matrix);
graph.showGraph();
graph.dsj(6);
graph.showDijkstra();
}
}
// 已访问过顶点集合
class VisitedVertex {
// 记录各个顶点是否被访问过,1:访问过;0:未访问过
public int[] already_arr;
// 每个下标对应的值为前一个顶点下标,会动态更新
public int[] pre_visited;
// 记录出发顶点到其他所有顶点的距离,会动态更新,求的最短距离就会存放到dis
public int[] dis;
/**
* 构造器
*
* @param length:表示顶点的个数
* @param index:出发定点对应的下标,比如G顶点,下标是6.
*/
public VisitedVertex(int length, int index) {
this.already_arr = new int[length];
this.pre_visited = new int[length];
this.dis = new int[length];
// 初始化dis数组
Arrays.fill(dis, 65535);
this.already_arr[index] = 1;
this.dis[index] = 0; // 自己与自己的dis为0.
}
// 判断是否被访问过
public boolean in(int index) {
return already_arr[index] == 1;
}
// 更新出发顶点到index顶点的距离
public void updateDis(int index, int len) {
dis[index] = len;
}
// 更新pre这个顶点的前驱顶点为index顶点
public void updatePre(int pre, int index) {
pre_visited[pre] = index;
}
// 返回出发顶点到index顶点的距离
public int getDis(int index) {
return dis[index];
}
//继续选择并返回新的访问节点,比如G完后,就是A作为新的访问节点(注意不是出发点)
public int updateArr() {
int min = 65535 ,index = 0;
for (int i = 0; i < already_arr.length; i++) {
if (already_arr[i] == 0 && dis[i] < min) {
min = dis[i] ;
index = i;
}
}
//更新index顶点被访问过
already_arr[index]=1;
return index;
}
//显示最后结果
public void show() {
System.out.println("---------");
for (int i : already_arr) {
System.out.print(i + " ");
}
System.out.println();
for (int i : pre_visited) {
System.out.print(i +" ");
}
System.out.println(
);
for (int i : dis) {
System.out.print(i + " ");
}
System.out.println();
//处理最后的结果,便于显示
char[] vertex = new char[] { 'A', 'B', 'C', 'D', 'E', 'F', 'G' };
int count = 0;
for (int i: dis) {
if (i != 65535) {
System.out.print(vertex[count]+"("+i + ")");
}else {
System.out.println("N");
}
count ++;
}
}
}
class Graph {
private char[] vertex; // 顶点数组
private int[][] matrix; // 邻接矩阵
private VisitedVertex visitedVertex ; //已访问的顶点的集合
public Graph(char[] vertex, int[][] matrix) {
this.vertex = vertex;
this.matrix = matrix;
}
// 显示图
public void showGraph() {
for (int[] link : matrix) {
System.out.println(Arrays.toString(link));
}
}
// 地杰斯特拉算法
public void dsj(int index) {
visitedVertex= new VisitedVertex(vertex.length, index);
update(index); //更新index顶点到周围顶点的距离和前驱节点
for (int i = 1; i < matrix.length; i++) {
index = visitedVertex.updateArr(); //选择并返回新的访问顶点
update(index);
}
}
//更新index下标顶点到周围顶点的距离和周围顶点的前驱结点
private void update(int index) {
int len = 0 ;
//根据遍历邻接矩阵的matrix[]行
for (int j = 0; j < matrix[index].length; j++) {
//len:出发顶点到index顶点的距离+从index到j顶点的距离的和
len = visitedVertex.getDis(index)+matrix[index][j];
//如果j顶点没有被直接访问过,并且len小于出发顶点到J顶点的距离,就需要更新
if (!visitedVertex.in(j) && len < visitedVertex.getDis(j)) {
visitedVertex.updatePre(j, index);
visitedVertex.updateDis(j, len);
}
}
}
//显示结果
public void showDijkstra() {
visitedVertex.show();
}
}
14.9 弗洛伊德算法
14.9.1 弗洛伊德(Floyd)算法介绍
- 和 Dijkstra 算法一样,弗洛伊德(Floyd)算法也是一种用于寻找给定的加权图中顶点间最短路径的算法。该算法 名称以创始人之一、1978 年图灵奖获得者、斯坦福大学计算机科学系教授罗伯特·弗洛伊德命名
- 弗洛伊德算法(Floyd)计算图中各个顶点之间的最短路径
- 迪杰斯特拉算法用于计算图中某一个顶点到其他顶点的最短路径。
- 弗洛伊德算法 VS 迪杰斯特拉算法:迪杰斯特拉算法通过选定的被访问顶点,求出从出发访问顶点到其他顶点的最短路径;弗洛伊德算法中每一个顶点都是出发访问点,所以需要将每一个顶点看做被访问顶点,求出从每 一个顶点到其他顶点的最短路径。
14.9.2 弗洛伊德(Floyd)算法图解分析
- 设置顶点 vi 到顶点 vk 的最短路径已知为 Lik,顶点vk 到vj 的最短路径已知为 Lkj,顶点vi 到vj 的路径为Lij, 则 vi 到vj 的最短路径为:min((Lik+Lkj),Lij),vk 的取值为图中所有顶点,则可获得 vi 到 vj 的最短路径
- 至于 vi 到 vk 的最短路径 Lik 或者 vk 到 vj 的最短路径Lkj,是以同样的方式获得
- 弗洛伊德算法的步骤:
(1)第一轮循环中,以 A(下标为:0)作为中间顶点【即把 A 作为中间顶点的所有情况都进行遍历, 就会得到更新距离表 和 前驱关系】, 距离表和前驱关系更新为: