动态规划从入门到精通-蓝桥杯

最新推荐文章于 2024-07-23 17:36:37 发布

ranzi.

最新推荐文章于 2024-07-23 17:36:37 发布

阅读量637

点赞数 1

分类专栏：蓝桥杯夺奖教程文章标签：蓝桥杯算法 python 数据结构动态规划 Powered by 金山文档

本文链接：https://blog.csdn.net/weixin_62808713/article/details/129107632

版权

蓝桥杯夺奖教程专栏收录该内容

15 篇文章 7 订阅

订阅专栏

一、了解动态规划

1.简单来说动态规划是一种状态转移与递推

2.例题引入——最少硬币问题

有多个不同面值的硬币(任意面值)；
数量不限；
输入金额S，输出最少硬币组合。
（回顾用贪心求解硬币问题。）

贪心法

硬币面值1、2、5。支付13元，要求硬币数量最少。

贪心法:

(1) 5元硬币，2个

(2) 2元硬币，1个

(3) 1元硬币，1个

正确! 答案是:2枚5元硬币+1枚2元硬币+1枚1元硬币。

硬币面值1、2、4、5、6。支付9元，要求硬币数量最少。

贪心法:

(1) 6元硬币，1个

(2) 2元硬币，1个

(3) 1元硬币，1个

错误! 答案是:1枚5元硬币+1枚4元硬币。

======>硬币问题的正解是动态规划！

动态规划

给定1，5，10，25，50这5种面值的硬币；
数量不限；
输入金额S，输出最少硬币组合。

首先定义数组Min[ ] 记录最少硬币数量。

对输入的某个金额i，Min[i]是最少的硬币数量。

1. 只考虑1元面值的硬币。

i=1元时，等价于：i=i-1 = 0元需要的硬币数量，加上1个1元硬币。

------>其中把Min[ ]叫做“状态”；把Min[ ]的变化叫做“状态转移”。

2.所有金额仍然都只用1元硬币。

i=2元时，等价于：i=i-1 = 1元需要的硬币数量，加上1个1元硬币。

i=3元时，...

i=4元时，...

3.在1元硬币的计算结果基础上，再考虑加上5元硬币的情况。从i=5开始就行了。

i=5元时，等价于:

(1) i = i-5 = 0元需要的硬币数量，加上1个5元硬币。Min[5]=1

(2) 原来的Min[5]=5。

取 (1) (2)的最小值，所以Min[5]=1。

i=6元时，等价于:

(1) i = i-5 = 1元需要的硬币数量，加上1个5元硬币。Min[6]=2

(2) 原来的Min[6]=6。

取 (1) (2)的最小值，所以Min[6]=2。

i=7元时，...

i=8元时，...

动态规划总结

用1元和5元硬币，结果:

递推关系（状态转移方程）:

Min[i] = min(Min[i], Min[i - 5] + 1)

继续处理其它面值硬币。

动态规划实现代码（实现递推关系）

上面代码状态名是Min[ ]，但是其实习惯上把状态命名为dp[ ]更好。

二、动态规划的两个特征

1.重叠子问题

子问题是原大问题的小版本，计算步骤完全一样;计算大问题的时候，需要多次重复计算小问题。

一个子问题的多次计算，耗费了大量时间。用DP处理重叠子问题，每个子问题只需要计算一次，从而避免了重复计算，这就是DP效率高的原因。

2.最优子结构

首先，大问题的最优解包含小问题的最优解。

其次，可以通过小问题的最优解推导出大问题的最优解。

三、记忆化

如果各个子问题不是独立的，如果能够保存已经解决的子问题的答案，在需要的时候再找出已求得的答案，可以避免大量的重复计算。

基本思路:用一个表记录所有已解决的子问题的答案，不管该问题以后是否被用到，只要它被计算过，就将其结果填入表中。

四、动态规划求解过程图解

五、最经典的动态规划问题——0/1背包

给定n种物品和一个背包：
物品i的重量是wi，
其价值为Vi，
背包的容量为C。

背包问题: 
选择装入背包的物品，使得装入背包中物品的总价值最大。
如果在选择装入背包的物品时，对每种物品i只有两种选择:
装入背包或不装入背包，称为0/1背包问题。

设xi表示物品i装入背包的情况：

xi=0，表示物品i没有被装入背包x；

i=1，表示物品i被装入背包。

有5个物品，重量分别是{2,2,6,5,4}，
价值分别为{6,3,5,4,6}，
背包的容量为10。

定义一个(n+1)X(C+1)的二维表dp[ ][ ]。
dp[i][i]表示把前i个物品装入容量为j的背包中获得的最大价值。

填表:按只放第1个物品、只放前2个、只放前3个......一直到放完，这样的顺序考虑。(从小问题扩展到大问题)

1、只装第1个物品。(横向是递增的背包容量)

2、只装前2个物品。

如果第2个物品重量比背包容量大，那么不能装第2个物品，情况和只装第1个一样。

如果第2个物品重量小于等于背包容量，那么:

（1）如果把物品2装进去(重量是2)，那么相当于只把1装到(容量-2)的背包中。

需要用到前面的需要用到前面的结果，即已经解决的子问题的答案经解决的子问题的答案。

（2）如果不装2，那么相当于只把1装到背包中。

------>取(1) 和 (2)的最大值。

3、只装前3个物品。

如果第3个物品重量比背包容量大，那么不能装第3个物品，情况和只装第1、2个一样。

如果第3个物品重量小于等于背包容量，那么:

（1）如果把物品3装进去(重量是6)，那么相当于只把1、2装到(容量-6)的背包中。

（2）如果不装3，那么相当于只把1、2装到背包中。

------>取(1) 和 (2)的最大值。

按这样的规律一行行填表，直到结束。现在回头考虑，装了哪些物品。

看最后一列，15>14，说明装了物品5，否则价值不会变化。

六、蓝桥杯真题(1174号)

1.DP状态设计

DP状态: 定义二维数组dp[ ][ ]，大小为N * C。

dp[i][j]:把前i个物品(从第1个到第i个) 装入容量为j的背包中获得的最大价值。

把每个dp[i][j]看成一个背包: 背包容量为j，装1~i这些物品。最后得到的dp[N][C]就是问题的答案:把N个物品装进容量C的背包的最大价值。

2.DP状态转移方程(递推公式)

递推计算到dp[i][j]，分2种情况:

(1)第i个物品的体积比容量j还大，不能装进容量的背包。那么直接继承前i-1个物品装进容量j的背包的情况即可: dp[i][j] = dp[i-1][j]。

(1)第i个物品的体积比容量j小，能装进背包。又可以分为2种情况: 装或者不装第i个。

1)装第i个。从前i-1个物品的情况下推广而来，前i-1个物品是dp[i-1][j]。第i个物品装进背包后，背包容量减少c[i]，价值增加w[i]。有:

dp[i][j] = dp[i-1][j-c[i]] + w[i]。

2)不装第i个。那么:dp[i][j] = dp[i-1][j]。

取1)和2)的最大值，状态转移方程:

dp[i][j] = max(dp[i- 1][j]，d[i- 1][j- c[i]] + w[i])

3.代码

七、空间优化:滚动数组

把dp[ ][ ]优化成一维的dp[ ]，以节省空间。

Dp[i][]是从上面一行dp[i-1]算出来的，第i行只跟第i-1行有关系，跟更前面的行没有关系:

dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - c[i]] + w[i])

优化:只需要两行dp[0][]、dp[1][]，用新的一行覆盖原来的一行，交替滚动。

经过优化，空间复杂度从O(N*C)减少为O(C)

1.交替滚动

定义：dp[2][i]: 用dp[O][]和dp[1][]交替滚动。

优点：逻辑清晰、编码不易出错，建议初学者采用这个方法。

代码：

now始终指向正在计算的最新的一行，old指向已计算过的旧的一行。

对照原递推代码，now相当于i，old相当于i - 1。

对照：

未经优化

优化之后

2.自我滚动

继续精简:用一个一维的dp[ ]就够了，自己滚动自己。

dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - c[i]] + w[i])

对照：

未经优化

优化之后

注意：自我滚动时j从小往大循环是错误的

优化之前填表的过程

自我滚动填表的过程

例如i = 2时，左图的dp[5]经计算得到dp[5] = 9，把dp[5]更新为9。

右图中继续往后计算，当计算dp[8]时，得dp[8] = dp[5]’ + 3 = 9+3 = 12。

这个答案是错的。

错误的产生是滚动数组重复使用同一个空间引起的。

注意：自我滚动时j从大往小循环是正确的

优化之前填表的过程

自我滚动填表的过程

例如i = 2时，首先计算最后的dp[9] = 9，它不影响前面状态的计算。

ranzi.

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
动态规划从入门到精通-蓝桥杯

最后得到的dp[N][C]就是问题的答案:把N个物品装进容量C的背包的最大价值。从前i-1个物品的情况下推广而来，前i-1个物品是dp[i-1][j]。那么直接继承前i-1个物品装进容量j的背包的情况即可: dp[i][j] = dp[i-1][j]。dp[i][j]:把前i个物品(从第1个到第i个) 装入容量为j的背包中获得的最大价值。例如i = 2时，左图的dp[5]经计算得到dp[5] = 9，把dp[5]更新为9。优化:只需要两行dp[0][]、dp[1][]，用新的一行覆盖原来的一行，交替滚动。
复制链接

扫一扫