动态规划(Dynamic Programming, DP),在选择DP算法的时候,往往是在决策问题上。动态规划先解决子问题,再逐步解决大问题。
一般情况下,我们能将问题抽象出来,并且问题满足无后效性,满足最优子结构,并且能明确地找出状态转移方程的话,DP是很好的选择。
①无后效性指的是,只要得出了当前状态,而不用管这个状态怎么来的,也就是说之前的状态已经用不着了。如果抽象出的状态有后效性,只用把这个值加入到状态的表示中;
②最优子结构(自下而上):在决策问题中,如果,当前问题可以拆分为多个子问题,并且依赖于这些子问题,那么我们称为此问题符合子结构。而若当前状态可以由某个阶段的某个或某些状态直接得到,那么就符合最优子结构。
③重叠子问题(自上而下):动态规划算法总是充分利用重叠子问题,通过每个子问题只解一次,把解保存在一个需要时就可以查看的表中,每次查表的时间为常数,如备忘录的递归方法、斐波那契数列的递归就是个很好的例子。
④状态转移:这个概念比较简单,在抽象出上述两点的的状态表示后,每种状态之间转移时值或者参数的变化。
背包问题:假设你是一个小偷,背着一个可装4磅东西的背包。可偷窃的商品有如下3件,为了让盗窃的商品价值最高,该选择哪些商品?
对于背包问题,先解决小背包(子背包)问题,在逐步解决原来的问题。
每个动态规划算法都从一个网格开始,网格的各行为商品,各列为不同容量(1~4磅)的背包。背包问题的网格(4*4)如下:
物品 | 1 | 2 | 3 | 4 |
---|---|---|---|---|
吉他(1磅,$1500) | ||||
音响(4磅,$3000) | ||||
笔记本电脑(3磅,$2000) |
- 吉他行:
第一个单元格表示背包的容量为1磅,而吉他的重量也是1磅,这意味着它能装入背包。
这是第一行,只有吉他可供选择。换言之,你假装现在还没法盗窃其他两件商品。
物品 | 1 | 2 | 3 | 4 |
---|---|---|---|---|
吉他(1磅,$1500) | $1500 | $1500 | $1500 | $1500 |
音响(4磅,$3000) | ||||
笔记本电脑(3磅,$2000) |
高亮处表示:如果有一个容量为4磅的背包,可在其中装入的商品的最大价值为1500美元。
- 音响行:
这是第二行,可偷的商品有吉他和音响。在每一行,可偷的商品都为当前行的商品以及之前各行的商品。因此,还不能偷笔记本电脑,而只能偷音响和吉他。
前3列都装不下音响(4磅),若背包容量为4磅(第4列),原来的最大值为1500磅,但如果装入音响而不是吉他,价值将为3000磅。所以丢弃吉他,装入音响。
物品 | 1 | 2 | 3 | 4 |
---|---|---|---|---|
吉他(1磅,$1500) | ||||
音响(4磅,$3000) | $1500 | $1500 | $1500 | $3000 |
笔记本电脑(3磅,$2000) |
- 笔记本电脑行:
物品 | 1 | 2 | 3 | 4 |
---|---|---|---|---|
吉他(1磅,$1500) | ||||
音响(4磅,$3000) | ||||
笔记本电脑(3磅,$2000) | $1500 | $1500 | $2000 | $2000 + $1500 |
前2列都装不下笔记本电脑(3磅)。
对于容量为3磅的背包,原来的最大价值为1500磅,但现在可选择盗窃2000磅的笔记本电脑而不是吉他,这样新的最大价值将为2000磅。
对于容量为4磅的背包,当前的最大价值为3000美元。可以不偷音响而偷笔记本电脑,但只值2000美元,价值没有原来高。但是笔记本电脑只有3磅,背包还有1磅没用。
在1磅的容量中,可装入商品的最大价值在之前计算过(第1列的最后1行)。所以最终为 2000+1500 = 3500磅。
这就是为何要计算小背包可装入商品的最大价值,即当余下了空间时,可根据这些子问题的答案来确定余下的空间可装入哪些商品。
代码表示:
CELL [i][j] = max(1, 2)
- 上一个单元格的值,即 CELL [i-1][j]
- 当前商品的价值+剩余空间的价值,剩余空间价值为:CELL [i-1][j-当前商品的重量]
相关题目:
31/100. Palindromic Substrings https://blog.csdn.net/weixin_39010770/article/details/85699382
参考链接:https://blog.csdn.net/MrLevo520/article/details/75676160