动态规划算法
介绍
1) 动态规划(Dynamic Programming)核心思想:将大问题分为小问题进行解决,从而一步步获取最优的处理算法
2) 与分治算法类似的是,其基本思想也是将待求问题分解成若干个子问题,先求解子问题,然后从这些子问题的解得到原问题的解
3) 与分治算法不同的是,适合于用动态规划求解的问题,经分解得到的子问题往往不是互相独立的。
4) 动态规划可以通过填表的方式来逐步推进,得到最优解
场景
背包问题
有一个背包,容量为4磅,现有如下物品:
物品 | 重量 | 价格 |
---|---|---|
吉他(G) | 1 | 1500 |
音响(S) | 4 | 3000 |
电脑(L) | 3 | 2000 |
1) 要求达到的目标为装入的背包总价值最大,且重量不能超出 | ||
2) 要求装入的物品不能重复 |
思路分析和图解
背包问题主要是指一个给定容量的背包、若干具有一定价值和重量的物品,如何选择物品放入背包使物品的价值最大。其中又分01背包和完全背包(完全背包指的是:每种物品都有无限件可用)
这里的问题属于01背包,即每个物品最多放一个。而无限背包可以转化为01背包。
算法的主要思想,利用动态规划来解决。每次遍历到的第i个物品,根据 w[i](第i个商品的重量)和 v[i](价值)来确定是否需要将该物品放入背包中。即对于给定的 n 个物品,设 v[i]、w[i] 分别为第 i 个物品的价值和重量,C 为背包的容量。再令 v[i][j] 表示在前 i 个物品中能够装入容量为 j 的背包中的最大价值。则我们有下面的结果:
物品 | 0 磅 | 1磅 | 2磅 | 3磅 | 4磅 |
---|---|---|---|---|---|
0 | 0 | 0 | 0 | 0 | |
吉他(G) | 0 | 1500(G) | 1500(G) | 1500(G) | 1500(G) |
音响(S) | 0 | 1500(G) | 1500(G) | 1500(G) | 3000(S) |
电脑(L) | 0 | 1500(G) | 1500(G) | 2000(L) | 2000(L)+1500(G) |
注:这里不太好理解,一定要动手自己填表,才能有感觉
(1) v[i][0]=v[0][j]=0; //表示 填入表 第一行和第一列是0
(2) 当w[i]> j 时:v[i][j]=v[i-1][j] // 当准备加入新增的商品的容量大于 当前背包的容量时,就直接使用上一个单元格的装入策略(j是本次循环的背包容量)
(3) 当j>=w[i]时: v[i][j]=max{v[i-1][j], v[i]+v[i-1][j-w[i]]}
下面上代码:
public class KnapsackProblem {
public static void main(String[] args) {
int[] w = {1,4,3};//物品的重量
int[] val = {1500,3000,2000};//物品的价值
int m = 4;//背包容量
int n = val.length;//物品的个数
//创建二维数组,表
int[][] v = new int[n+1][m+1];
//初始化第一行和第一例为0(不处理也许,默认为0)
for (int i = 0; i < v.length; i++) {
v[i][0]=0;
}
for (int j = 0; j < v[0].length; j++) {
v[0][j]=0;
}
//动态规划处理
for (int i = 1; i < v.length; i++) {//不处理第一行
for (int j = 1; j < v[0].length; j++) { //循环背包容量
if (w[i-1]<=j){
/*当将要放入的物品重量小于等于背包容量的时候
*有两种可能:
* 1.直接放进去,剩余容量>=0,利用起来也就是之前计算过的背包容量下的最优解,
* 价值比上一个单元格大(每一个单元格都是自己条件下的最优解)
* 2.直接放进去,加上剩余容量最优解,价值不如上一个单元格大
*/
v[i][j] = Math.max(v[i-1][j],
val[i-1]+v[i-1][j-w[i-1]]);
}
}
//输出二维数组
for (int i = 0; i < v.length; i++) {
for (int j = 0; j < v[0].length; j++) {
System.out.print(v[i][j]+" ");
}
System.out.println();
}
}
}
现在增加一个需求:需要知道哪些物品被加入到了背包中
修改代码如下:
public class KnapsackProblem {
public static void main(String[] args) {
int[] w = {1,4,3};//物品的重量
int[] val = {1500,3000,2000};//物品的价值
int m = 4;//背包容量
int n = val.length;//物品的个数
//创建二维数组,表
int[][] v = new int[n+1][m+1];
//为了记录哪些物品被放入背包,创建一个二维数组
int[][] path = new int[n+1][m+1];
//初始化第一行和第一例为0(不处理默认为0)
for (int i = 0; i < v.length; i++) {
v[i][0]=0;
}
for (int j = 0; j < v[0].length; j++) {
v[0][j]=0;
}
//动态规划处理
for (int i = 1; i < v.length; i++) {//不处理第一行
for (int j = 1; j < v[0].length; j++) {//不处理第一列
if (w[i-1]<=j){
/*当将要放入的物品重量小于等于背包容量的时候
*有两种可能:
* 1.直接放进去,剩余容量>=0,利用起来也就是之前计算过的背包容量下的最优解,
* 价值比上一个单元格大(每一个单元格都是自己条件下的最优解)
* 2.直接放进去,加上剩余容量最优解,价值不如上一个单元格大
*/
// v[i][j] = Math.max(v[i-1][j],
// val[i-1]+v[i-1][j-w[i-1]]);
//增加需求:记录哪些物品加入了背包
if (v[i-1][j]<val[i-1]+v[i-1][j-w[i-1]]){
v[i][j] = val[i-1]+v[i-1][j-w[i-1]];
//记录
path[i][j] = 1;
}else{
v[i][j] = v[i-1][j];
}
}else {
//放入的物品重量超过背包容量,直接采用上一个单元格的最优解
v[i][j] = v[i-1][j];
}
}
}
//输出二维数组
for (int i = 0; i < v.length; i++) {
for (int j = 0; j < v[0].length; j++) {
System.out.print(v[i][j]+" ");
}
System.out.println();
}
//找出放入的物品
/*从后往前遍历,因为最终的最优解在最后面,
*先遍历找到一个放入的物品,再用剩余容量找到属于它的最优解,
* 得到第二个物品,以此类推
*/
int i = path.length-1;
int j = path[0].length-1;
while(i>0 && j>0){
if(path[i][j]==1){//说明这个物品被放入过
System.out.printf("放入了第%d个物品\n",i);
//注意要利用剩余容量继续找其他物品
j -= w[i-1];
}
i--;
}
}
}
注:学习笔记来源于尚硅谷视频学习总结记录