动态规划算法的介绍
- 动态规划(Dynamic Programming)算法的核心思想是:将大问题划分为小问题进行解决,从而一步步获取最优解的处理算法
- 动态规划算法与分治算法类似,其基本思想也是将待求解问题分解成若干个子问题,先求解子问题,然后从这些子问题的解得到原问题的解
- 与分治法不同的是,适合于用动态规划求解的问题,经分解得到子问题往往不是互相独立的 ( 即下一个子阶段的求解是建立在上一个子阶段的解的基础上,进行进一步的求解 )
- 动态规划可以通过填表的方式来逐步推进,得到最优解
动态规划算法最佳实践-背包问题
背包问题:有一个背包,容量为 4 磅 ,现有如下物品
物品 | 重量 | 价格 |
---|---|---|
吉他 | 1 | 1500 |
音响 | 4 | 3000 |
电脑 | 3 | 2000 |
- 要求达到的目标为装入的背包的总价值最大,并且重量不超出
- 要求装入的物品不能重复
思路分析
- 背包问题主要是指一个给定容量的背包、若干具有一定价值和重量的物品,如何选择物品放入背包使物品的价值最大。其中又分 01 背包和完全背包(完全背包指的是:每种物品都有无限件可用)
- 这里的问题属于 01 背包,即每个物品最多放一个。而无限背包可以转化为 01 背包。
- 算法的主要思想,利用动态规划来解决。每次遍历到的第 i 个物品,根据 w[i]和 v[i]来确定是否需要将该物品放入背包中。即对于给定的 n 个物品,设 val[i-1]、w[i-1]分别为第 i 个物品的价值和重量,m为背包的容量。再令 v[i][j]表示在前 i 个物品中能够装入容量为 j 的背包中的最大价值。
则会得到下面的结果
- v[i][0]=v[0][j]=0 // 表示填入表第一行和第一列是 0(方便计数)
- 当 w[i-1]> j 时:v[i][j]=v[i-1][j] // 当准备加入新增的物品容量大于当前背包的容量时,就直接用上一个单元格的装入策略
- 当 j>=w[i-1]时: v[i][j]=max( v[i-1][j], val[i-1]+v[i-1][j-w[i-1]] ) // 当准备加入的新增的物品容量小于等于当前背包的容量(即装完当前物品后还有容量)就把上一个单元格的装入策略的价值 与 当前物品的价值+上一个单元格所剩物品容量所在的那一列规划的价值 比较取最大的一个
代码实现
public class DynamicProgramming {
public static void main(String[] args) {
int[] w = {1, 4, 3}; // 物品的重量
int[] val = {1500, 3000, 2000}; // 物品的价值
int m = 4; // 背包的容量
int n = val.length; // 物品的种类数
// v[i][j] 表示在前i个物品中能够装入容量为j的背包中的最大价值
int[][] v = new int[n+1][m+1];
// 为了记录物品放入的情况,创建一个二维数组
int[][] path = new int[n+1][m+1];
// 初始化第一行和第一列
for (int i = 0; i < v.length; i++) {
v[i][0] = 0;
}
// Arrays.fill(v[0], 0);
for (int i = 0; i < v[0].length; i++) {
v[0][i] = 0;
}
// 根据前面的公式来进行动态规划
for (int i = 1; i < v.length; i++) {
for (int j = 1; j < v[0].length; j++) {
if (w[i-1] > j) { // 如果物品的重量 > 表格所规划的重量
v[i][j] = v[i-1][j];
} else {
// 把上一行物品的价值 与 当前物品的价值+上一行所剩物品重量规划的价值 比较取最大的那一个
v[i][j] = Math.max(v[i-1][j], val[i-1]+v[i-1][j-w[i-1]]);
//为了记录物品放入背包的情况,因此上面的式子
if (v[i-1][j] < val[i-1]+v[i-1][j-w[i-1]]){
v[i][j] = val[i-1]+v[i-1][j-w[i-1]];
// 把当前情况记录到path中
path[i][j] = 1;
} else {
v[i][j] = v[i-1][j];
}
}
}
}
// 打印二维数组v
for (int[] i : v) {
for (int j : i) {
System.out.print(j + " ");
}
System.out.println();
}
// 打印path
System.out.println("path=============");
for (int[] i : path) {
for (int j : i) {
System.out.print(j + " ");
}
System.out.println();
}
System.out.println("=================");
// 从后往前打印,因为最后面的容量最大的能拿到最大值
int i = path.length - 1;
int j = path[0].length - 1;
while (i > 0 && j > 0) {
if (path[i][j] == 1) {
System.out.printf("第%d个物品放入背包\n", i);
// 换到剩下重量所放入物品的列
j -= w[i-1];
}
i--;
}
}
}
运行结果
注:以上大部分内容来源于韩顺平老师的数据结构和算法笔记