动态规划（DP）算法

最新推荐文章于 2024-08-13 16:54:01 发布

置顶 lulin916

最新推荐文章于 2024-08-13 16:54:01 发布

阅读量2.7k

点赞数 2

分类专栏：刷题漫漫路

本文链接：https://blog.csdn.net/weixin_39010770/article/details/85679767

版权

刷题漫漫路专栏收录该内容

6 篇文章 0 订阅

订阅专栏

动态规划（Dynamic Programming, DP），在选择DP算法的时候，往往是在决策问题上。动态规划先解决子问题，再逐步解决大问题。

一般情况下，我们能将问题抽象出来，并且问题满足无后效性，满足最优子结构，并且能明确地找出状态转移方程的话，DP是很好的选择。
①无后效性指的是，只要得出了当前状态，而不用管这个状态怎么来的，也就是说之前的状态已经用不着了。如果抽象出的状态有后效性，只用把这个值加入到状态的表示中；
②最优子结构(自下而上)：在决策问题中，如果，当前问题可以拆分为多个子问题，并且依赖于这些子问题，那么我们称为此问题符合子结构。而若当前状态可以由某个阶段的某个或某些状态直接得到，那么就符合最优子结构。
③重叠子问题(自上而下)：动态规划算法总是充分利用重叠子问题，通过每个子问题只解一次，把解保存在一个需要时就可以查看的表中，每次查表的时间为常数，如备忘录的递归方法、斐波那契数列的递归就是个很好的例子。
④状态转移：这个概念比较简单，在抽象出上述两点的的状态表示后，每种状态之间转移时值或者参数的变化。

背包问题：假设你是一个小偷，背着一个可装4磅东西的背包。可偷窃的商品有如下3件，为了让盗窃的商品价值最高，该选择哪些商品？

对于背包问题，先解决小背包（子背包）问题，在逐步解决原来的问题。
每个动态规划算法都从一个网格开始，网格的各行为商品，各列为不同容量（1~4磅）的背包。背包问题的网格（4*4）如下：

物品	1	2	3	4
吉他（1磅，$1500）
音响（4磅，$3000）
笔记本电脑（3磅，$2000）

吉他行：

第一个单元格表示背包的容量为1磅，而吉他的重量也是1磅，这意味着它能装入背包。
这是第一行，只有吉他可供选择。换言之，你假装现在还没法盗窃其他两件商品。

物品	1	2	3	4
吉他（1磅，$1500）	$1500	$1500	$1500	$1500
音响（4磅，$3000）
笔记本电脑（3磅，$2000）

高亮处表示：如果有一个容量为4磅的背包，可在其中装入的商品的最大价值为1500美元。

音响行：

这是第二行，可偷的商品有吉他和音响。在每一行，可偷的商品都为当前行的商品以及之前各行的商品。因此，还不能偷笔记本电脑，而只能偷音响和吉他。
前3列都装不下音响（4磅），若背包容量为4磅（第4列），原来的最大值为1500磅，但如果装入音响而不是吉他，价值将为3000磅。所以丢弃吉他，装入音响。

物品	1	2	3	4
吉他（1磅，$1500）	~~$1500~~	~~$1500~~	~~$1500~~	~~$1500~~
音响（4磅，$3000）	$1500	$1500	$1500	$3000
笔记本电脑（3磅，$2000）

笔记本电脑行：

物品	1	2	3	4
吉他（1磅，$1500）	~~$1500~~	~~$1500~~	~~$1500~~	~~$1500~~
音响（4磅，$3000）	~~$1500~~	~~$1500~~	~~$1500~~	~~$3000~~
笔记本电脑（3磅，$2000）	$1500	$1500	$2000	$2000 + $1500

前2列都装不下笔记本电脑（3磅）。
对于容量为3磅的背包，原来的最大价值为1500磅，但现在可选择盗窃2000磅的笔记本电脑而不是吉他，这样新的最大价值将为2000磅。
对于容量为4磅的背包，当前的最大价值为3000美元。可以不偷音响而偷笔记本电脑，但只值2000美元，价值没有原来高。但是笔记本电脑只有3磅，背包还有1磅没用。
在1磅的容量中，可装入商品的最大价值在之前计算过（第1列的最后1行）。所以最终为 2000+1500 = 3500磅。

这就是为何要计算小背包可装入商品的最大价值，即当余下了空间时，可根据这些子问题的答案来确定余下的空间可装入哪些商品。

代码表示：

CELL [i][j] = max（1, 2）