背包问题
多阶段动态规划问题
有一类动态规划可解的问题,它可以描述称为若干有序的阶段,且每个阶段的状态只和上一个阶段的状态有关,一般把这类问题称为多阶段规划问题。
01 背包问题
01背包问题描述如下:
有 n 件物品,每件物品的重量为 w[i],价值为 c[i]。现有一个容量为 V 的背包,问如何选取物品放入背包,使得背包内物品的总价值最大。其中每种物品都只有一件。
例子:
5 8 // 5 件物品, 容量为 83 5 1 2 2 // w[i] 重量
4 5 2 1 3 // c[i] 价值
如果采取暴力搜索的方法,每件物品都有两种选择,因此 n 件物品就有 2n,而O( 2n) 的时间复杂度完全是不能接受的。而使用动态规划可以将复杂度将为 O(nV)。
令dp[i][v]
表示前 i 件物品恰好装入容量为 v 的背包中所能获得的最大价值。那怎么求解 dp[i][v]
呢?
考虑第 i 件物品的选择策略,有两种策略:
- 不放第 i 件物品,那么转化为前 i - 1 件物品恰好装入容量为 v 背包中所能获得的最大价值,
dp[i-1][v]
。 - 放第 i 件物品,那么问题转换为前 i - 1 件物品恰好装入容量为 v - w[i] 的背包中所能获得的最大价值,也就是
dp[i-1][v-w[i]] + c[i]
由于只有这两种策略,所以状态转移方程为
dp[i][v] = max{ dp[i-1][v], dp[i-1][v-w[i]] + c[i] }
由于 dp[i][v]
只与之前的状态 dp[i-1][]
有关,所以可以枚举 i 从 1 到 n,v 从 0 到 V,通过边界 dp[0][v] = 0
(即前 0 件物品放入任何容量 v 的背包中都只能获得价值 0)就可以把整个 dp 数组递推出来。而 dp[i][v]
表示的恰好为 v 的情况,所以需要枚举 dp[n][v]
取其最大值。
因此可以写出代码:
for(int i = 1; i <= n; i++) {
// 装第 i 件物品
for(int v = w[i]; v <= V; v++) {
dp[i][v] = max(dp[i-1][v], dp[i-1][v-w[i]] + c[i]);
}
}
时间复杂度和空间复杂度都是 O(nV),时间复杂度不能再优化,但空间复杂度还可以优化。
注意到状态转移方程中计算dp[i][v]
总是需要 dp[i-1][v]
左侧部分的数据(即正上方和左上方的数据),且当计算 dp[i+1][]
时,dp[i-1]
的数据又用不到了(只需要用 dp[i][]
),所以我们可以直接开一个一维数组dp[v]
!枚举方向从 1 到 n,v 从 V 到 0 (逆序),这样,状态转移方程为:
dp[v] = max{ dp[v], dp[v-w[i]] + c[i] }
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kje9KWb6-1584931877976)(./img/01bag.png)]
可以这样理解,dp[i][v]
左上角的数据和 dp[i][v]
右边的数据放在同一个数组里面,每次计算出一个 dp[i][v]
,将相当于把 dp[i-1][v]
覆盖掉,因为之后的计算不需要再用到了。我们把这种技巧称为 滚动数组。
代码如下:
for(int i = 1; i <= n; i++) {