动态规划
导语:本人热爱算法,动态规划是竞赛必备的技能,而动态规划对于新手来说很不“友好”,这篇将会围绕“动态规划”这个板块,尽量为大家讲明白动态规划。文中会有很多个人理解,如有错误,感谢指出。
本篇难度:普及-
动态规划
-
动态规划是什么?
动态规划,是求解决策过程最优化的过程。
-
哪些题可以用动态规划?
如果一个问题的求解可以分成多个互相联系的阶段,在每一阶段都需要做出一个决策,从而使整体结果最优化。那么这种问题就可以用动态规划来解决。
-
动态规划的基本思路
将这个问题分解成多个互相联系的阶段,从前往后一步一步根据情况做决策,也就是:根据子阶段(上一阶段)的决策推导出当前阶段的决策。这里的“推导”一词,就是动态规划中的“转移”。
-
动态规划三要素
- 最优子结构:当前阶段的决策依赖于上一阶段的决策,上一阶段的决策是当前的最优策略,而这些阶段中最优的我们称之为”最优子结构“。
- 状态转移方程:当前阶段的决策以依赖于上一阶段的决策,由上一阶段的决策推导出当前阶段的决策的公式叫做“状态转移方程”。
- 问题边界:如果每一个阶段的决策都依赖于上一阶段的决策,那这个问题不就类似于无穷地递归了吗?所以,总有一个阶段,它的决策是已经确定的(在定义问题时就确定,隐含在逻辑之中)。
(看不懂没关系,一会儿吃栗子)
-
动态规划的解题过程
- 问题建模。分析问题由哪些阶段组成,每一阶段的决策有几种,每一阶段的决策依赖于哪几个子问题。
- 确定问题边界。也就是找到最开头的那个阶段,这个阶段没有子结构,无法由上一个阶段推导而来,这个阶段的决策蕴藏在题目逻辑中。
- 写状态转移方程。根据题目逻辑写出上一阶段的决策如何推导出当前决策。
栗子:爬楼梯(传送门)
有一座高度是N级台阶的楼梯,从下往上走,每跨一步只能向上1级或者2级台阶。要求用程序来求出一共有多少种走法。
比如,每次走1级台阶,一共走10步,这是其中一种走法。我们可以简写成 1,1,1,1,1,1,1,1,1,1。
再比如,每次走2级台阶,一共走5步,这是另一种走法。我们可以简写成 2,2,2,2,2。
这个问题能不能用动态规划求解?它的三要素分别是什么?(重要,一定要仔细看!新手动规基本思路)
- 对于第一个问题,我们发现这个问题可以分为多个互相联系的阶段, 每个阶段要做出“走一步”或“走两步”的决策,故这道题可以用动态规划来求解。
- 对于第二个问题
- 首先我们寻找最后一个阶段的“最优子结构”。这个问题中每个阶段都有两种选择——“走一步”或“走两步”,如果我们确定最后一个阶段选择“走一步”, 那么这个问题就变成了——爬上高度是9级台阶的楼梯有几种走法;如果我们确定最后一个阶段选择“走两步”,那么这个问题就变成了——爬上高度是8级台阶的楼梯有几种走法。得出结论,“爬上高度是10级台阶的楼梯有几种走法”这个问题的最优子结构是“爬上高度是9级台阶的楼梯有几种走法”和“爬上高度是8级台阶的楼梯有几种走法”。
- 我们设F(n)表示爬上高度是n级台阶的楼梯有几种走法,每个阶段有两种抉择,走一步或走两步,而这两种情况都要算进情况总数里。不难发现,F(n) = F(n-1) + F(n-2)。
- 最后我们要知道问题的边界。F(10)由F(9)、F(8)推导而来,F(9)由F(8)、F(7)推导而来,F(8)由F(7)、F(6)推导而来……那么F(1)由F(0)、F(-1)推导而来吗?F(-1)又是怎么回事?爬上高度是-1级台阶的楼梯有几种走法吗?无法解释。由于F(1)无法走两步到达的特殊性,我们要人为规定F(1)的值,F(0)同样,这就是问题的边界了。
我们可以写出代码:
C++代码:
#include<bits/stdc++.h>
using namespace std;
int n, dp[1000]; // dp[n]即F(n)
int main() {
cin >> n; // 楼梯高度
dp[0] = dp[1] = 1; // 问题边界
for (int i=2; i<=n; i++) {
dp[n] = dp[n-1] + dp[n-2]; // 状态转移方程
}
cout << dp[n];
}
其实我们发现dp数组可以再次优化,每次状态转移只用到前两个状态,于是我们可以写个滚动数组或是只用三个变量代替。
// 上下文略
for (int i=2; i<=n; i++) {
dp[n%3] = dp[(n-1)%3] + dp[(n-2)%3];
}
cout << dp[n%3];
这样dp数组就只用开三个了。
怎么样?动态规划闹明白了吗?不明白没关系,我第一次接触的时候也是一脸懵,练的题多了,动态规划的思想就会在脑中根深蒂固,这时再理解就不难了。