Dynamic Programming——动态规划原理总结

最新推荐文章于 2021-11-18 17:39:31 发布

W24-

最新推荐文章于 2021-11-18 17:39:31 发布

阅读量364

点赞数 1

分类专栏：动态规划算法文章标签：动态规划

本文链接：https://blog.csdn.net/qq_39583450/article/details/109063137

版权

动态规划算法专栏收录该内容

9 篇文章 1 订阅

订阅专栏

动态规划原理

动态规划（Dynamic Programming）的与分治方法相似，都是通过组合子问题的解来求解原问题，其中的“Programming”并非“编程”之意，而是“借助表格求解问题”的意思。

分治算法的思想是将计算问题分解为规模较小的相似的子问题，然后分别求解这些子问题，再将子问题的解合并为原始问题的解。分治算法相对简单、直观、独立地处理各个子问题，而不对划分产生的子问题的特性和相互联系进行研究，导致了求解某些子问题的分治算法效率不高。
与之相反，动态规划应用于子问题重叠的情况，即不同的子问题具有公共的子子问题（子问题的求解是递归进行的，将其划分为更小的子子问题）。在这种情况下，分治算法会反复地求解公共子问题；而动态规划算法对每个子问题只求解一次，并将其解保存在一个表格中，从而无需每次对一个子问题都重复计算，避免了大量不必要的计算工作。

动态规划方法通常用来求解最优化问题（optimization problem），最优化问题指在一组给定的约束条件 $C$ 和一个实值代价函数 $F (x)$ 下求解满足 $C$ 并使得 $F (x)$ 达到最小值或最大值的一个结构 $x$ 。

动态规划采用分治的思想求解计算问题，并利用子问题之间的关联特性来提高计算效率，其计算过程依赖两个特征：

优化子结构（最优子结构）：如果最优化问题的最优解可以通过它的一系列子问题的最优解构造得到，则称该最优化问题具有优化子结构。
也可以说如果一个问题的最优解包含其子问题的最优解，我们就称此问题具有优化子结构。
有优化子结构性质，我们就可以利用这种子结构从子问题的最优解构造出原问题的最优解。
作为构成原问题最优解的组成部分，每个子问题的解就是它本身的最优解，这一点可以通过反证法来证明：假定子问题的解不是其自身的最优解，那么我们就可以从原问题的解中“剪切”掉这些非最优解，将最优解“粘贴”进去，从而得到原问题的一个更优的解，这与最初的解是原问题的前提假设矛盾。

当然具有优化子结构性质可能意味着适合应用贪心策略。
重叠子问题：如果根据优化问题的优化子结构直接采用分治方法求解该问题将导致某些子问题重复计算，则称该优化问题具有重叠子问题。
即问题的递归算法会反复地求解相同的子问题，而不是一直生成新的子问题，我们就称最优化问题具有重叠子问题。
动态规划算法通常利用重叠子问题性质，对每个子问题求解一次，将解存入一个表中，当再次需要这个子问题的时候直接查表，每次查表的代价为常数时间。

对于具有优化子结构和重叠子问题的优化问题，可以根据优化子结构来设计数据结构和子问题的计算顺序，从规模较小的子问题开始自底向上地计算各个子问题的解，确保每个子问题仅求解一次，将求得的子问题的解和构造最优价所需要的信息存储在数据结构中。最后再根据构造最优解的信息得到优化问题的解。由此可见，针对优化问题设计动态规划算法大致分为以下四个步骤：

分析优化子结构和重叠子问题。
该步骤分析优化问题是否有优化子结构和重叠子问题。寻找问题的优化子结构需要通过研究问题和不断尝试，并要求算法设计者具有一定的想象力和创新思维。尽管如此，优化子结构仍表现出一些常用的模式，如后缀形式（如最长公共子序列问题），中缀形式（矩阵链乘问题），前缀形式（0-1背包问题）和子树子问题（如最优二叉搜索树问题）。
递归地定义最优解的值。
该步骤递归地定义优化子结构中各个子问题的解，并根据优化子结构将规模较大的子问题的解（或解的代价）通过恰当的数学运算表达成规模较小的子问题的解（或解的代价）。通常，递归方程的初始值给出了规模最小的子问题的解（或解的代价）。
自底向上地计算最优解的值。
根据第二步得到的递归方程及其初始化条件，设计数据结构和子问题的计算顺序，确保处理规模较大的子问题时递归方程中涉及的规模较小的子问题的解均已被计算出来并存储在数据结构中，这使得相应子问题的解可以通过查询数据结构来获得。然后，根据递归方程的初始条件，自底向上地计算最优解的代价并保存，获取构造最优解的信息。
利用计算出的信息构造最优解。
根据第三步获得的构造最优解的信息，最终将问题的解构造出来。前三步是动态规划算法求解问题的基础，如果我们仅仅需要一个最优解的值而非解本身，可以忽略该步骤；否则就需要在执行步骤 3 时维护一些额外信息以便用来构造一个最优解。

动态规划方法是付出额外内存空间来节省计算时间，是典型的时空权衡（time-memory trade-off）的例子。而时间上的节省可能是非常巨大的：可能将一个指数时间的朴素递归算法转化为一个多项式时间的解法。如果子问题的数量是输入规模的多项式函数，而我们可以在多项式时间内由子子问题的最优解构造出每个子问题的最优解，那么动态规划方法的总运行时间就是多项式阶的。

最长公共子序列

定义

给定序列X，Y，Z，如果Z既是X的子序列又是Y的子序列，则称Z是X和Y的公共子序列。X，Y的长度最长的公共子序列成为X，Y的最长公共子序列，记为LCS(X, Y)；

子序列与子串不相同，子序列中的元素可以不连续。如Z=<B,C,D,B>是X=<A,B,C,B,D,A,B>的子序列。

现假设序列 $X=x_1，x_2，…，x_m$ ， $Y = y_1，y_2，…，y_n$

分析优化子结构

分析：

如果 $x_m = y_n$ ，则 LCS(X, Y) 的最末字符应为公共字符 $x_m = y_n>$ ，而其余部分应为前缀 $X_{m-1}$ 和 $Y_{n-1}$ 的最长公共子序列，即需要求解子问题 LCS( $X_{m-1}, Y_{n-1}$ ).
如果 $x_m ≠ y_n$ ，则LCS(X, Y)的最末字符不可能既为 $x_m$ ，又为 $y_n$ 。若最末字符不为 $y_n$ ，则LCS(X, Y)与字符 $y_n$ 无关，即只需求解子问题LCS( $X, Y_{n-1}$ ).
若最末字符不为 $x_m$ ，则LCS(X, Y)与字符 $x_m$ 无关，即只需求解子问题LCS( $X_{m-1}, Y_{n}$ ).

上述直观分析结果表明，无论何种情况，LCS(X, Y)均可以由某些子问题的解构造得到，即最长公共子序列具有优化子结构。
$Y)=\left\{ \begin{array}{ll} LCS(X_{m-1}, Y_{n-1}) + < x_m = y_n> & 如果x_m = y_n\\ LCS(X_{m-1}, Y) & 如果x_m ≠ y_n，z_k ≠x_m\\ LCS(X, Y_{n-1}) & 如果x_m ≠ y_n，z_k ≠y_n \end{array} \right.$

分析重叠子问题

$L C S (X, Y)$ =====> $LCS(X_{m-1}, Y)$ , $LCS(X, Y_{n-1})$ , $LCS(X_{m-1}, Y_{n-1})$

$LCS(X_{m-1}, Y)$ =====> $LCS(X_{m-2}, Y)$ , $LCS(X_{m-1}, Y_{n-1})$ , $LCS(X_{m-2}, Y_{n-1})$

$LCS(X, Y_{n-1})$ =====> $LCS(X_{m-1}, Y_{n-1})$ , $LCS(X, Y_{n-2})$ , $LCS(X_{m-1}, Y_{n-2})$

$LCS(X_{m-1}, Y_{n-1})$ =====> $LCS(X_{m-2}, Y_{n-1})$ , $LCS(X_{m-1}, Y_{n-2})$ , $LCS(X_{m-2}, Y_{n-2})$

子问题 $LCS(X_{m-2}, Y_{n-1})$ 和 $LCS(X_{m-1}, Y_{n-2})$ 均被重复计算。这说明最长公共子序列问题具有重叠子问题。

递归定义最优解的代价

令C[i, j]表示 $X_{i}, Y_{j}$ 的最长公共子序列的长度。
$j]=\left\{ \begin{array}{ll} 0 & 如果\ i=0\ 或\ j=0\\ C[i-1, j-1] + 1 & 如果\ 0<i\leq m,0<j\leq n \ 且\ x_i=y_j\\ max(C[i, j-1], C[i-1, j]) & 如果\ 0<i\leq m,0<j\leq n \ 且\ x_i≠y_j \end{array} \right.$

自底向上计算解的代价

根据最优解的代价方程，可以采用二维数组C[0:m][0:n]存储所有子问题的解，C[i,j]记录 $LCS(X_i, Y_j)$ 的长度。

根据初始化条件，C[0,j] = C[i,0] = 0。为了确保计算C[i,j]之前，相关的三个子问题的解的代价C[i-1, j-1], C[i, j-1], C[i-1, j]均已经被计算出来。这样可以采用逐行计算、逐列计算等顺序进行计算。

另外用二维数组B[1:m][1:n]记录构造最优解的信息。

B[i,j] = '↖'表示C[i,j] = C[i-1, j-1] + 1

B[i,j] = '←'表示C[i,j] = C[i, j-1]

B[i,j] = '↑'表示C[i,j] = C[i-1, j]

1. m <—— length(X), n <—— length(Y);
2. For i from 0 to m: Do C[i,0] = 0;
3. For j from 0 to n: Do C[0,j] = 0;
4. For i from 0 to m:
5.    for j from 0 to n:
6.        if xi = yj: Then C[i,j] = C[i-1, j-1] + 1, B[i,j] = ↖;
7.        else if C[i-1,j] >= C[,j-1]: Then C[i,j] = C[i-1,j], B[i,j] = ↑;
8.        else C[i,j] = C[i,j-1], B[i,j] = ←;
9. 输出 C and B

构造最优解

构造过程从B[m,n]出发，根据B中记录的“指针”来访问相应的数据。

如果B[i,j] = ↖，则表明 $X_i = Y_j$ 是最长公共子序列的末尾字符。

矩阵链乘法

定义

输入：n个矩阵 $A_1,…$ A_n，其规模存储于数组 $P [0 : n]$ ， $A_i$ 是 $P [i - 1] * P [i]$ 的矩阵。

输出：计算连乘积 $A_1·A_2·…·A_{n-1}·A_{n}$ 的代价最小的乘法方案。

分析优化子结构

任何一个乘法方案 $F$ 必然在某个 $k$ 值（ $\leq k \leq n-1$ ）上按照 $A_1·A_2·…·A_k)\ ·(A_{k+1}·A_{k+2}·…·A_{n})$ 计算连乘积。如果 $F$ 是代价最小的乘法方案，则 $F_{1,k}$ 必是 $A_1·A_2·…·A_k$ 的代价最小的方案，而 $F_{k+1,n}$ 必是 $A_{k+1}·A_{k+2}·…·A_{n}$ 的代价最小的乘法方案；否则，将 $F_{1,k}$ 或 $F_{k+1,n}$ 调换成连乘积代价更小的方案，则将得到带价比F更小的方案。这说明，问题的解可以通过子问题的解构造得到，即问题具有优化子结构。

分析重叠子问题

以 $A_1·A_2·A_3·A_4$ 举例，子问题 $A_1·A_2，A_2·A_3，A_3·A_4$ 均被重复计算。这说明最长公共子序列问题具有子问题重叠性。

递归定义最优解的代价

求解矩阵链乘法的最优方案时需要处理的子问题均是计算连续若干个矩阵链乘的最优方案，即求解形如 $A_i·A_{i+1}·…·A_{j}$ 的连乘积的最优乘法方案。由于 $i\leq j$ ，故求解矩阵链乘法时需要考虑的子问题共有 $n (n - 1) / 2$ 个。于是子问题空间的大小为 $O(n^2)$ 。

令 $m_{ij}$ 表示连乘积 $A_i·A_{i+1}·…·A_{j}$ 的最优乘法方案的代价。由矩阵链乘法的优化子结构及上面分析可以得到
$\begin{array}{ll} m_{ij} = 0 & 如果\ i = j\\ m_{ij} = min_{i \leq k < j}(m_{ik} + m_{k+1j} + P_{i-1}P_{k}P_{j}) & 如果\ i < j \end{array}$

自底向上计算解的代价

根据最优解的代价方程，可以采用二维数组 $M [1 : n] [1 : n]$ 存储所有子问题的解的代价， $M [i, j]$ 记录 $A_i·A_{i+1}·…·A_{j}$ 的最优乘法方案的代价。

根据初始化条件， $M [i, i] = 0$ ，其中 $\leq i \leq n$ 。为了避免子问题重复求解，在计算 $M [i, j]$ 之前，需要确保相关的子问题已被计算出来，这需要按照子问题规模递增的顺序进行处理，即先处理1个矩阵的连乘积，再处理两个矩阵的连乘积，再处理三个矩阵的连乘积……于是，我们从主对角线开始，依次处理每条对角线元素即可，每条对角线逐行处理各个元素。

另用二位数组 $S [1 : n] [1 : n]$ 记录构造最优解的信息。由于使得方程
$m_{ij} = min_{i \leq k < j}(m_{ik} + m_{k+1j} + P_{i-1}P_{k}P_{j})$
取等号的 $k$ 值意味着连乘积 $A_i·A_{i+1}·…·A_{j}$ 应按照
$A_i·…·A_k)·(A_{k+1}·A_{k+1}·…·A_{j})$
进行计算，故 $S [i] [j]$ 记录该k值即可。

输入：矩阵A1，……，An的规模，存储于数组P[0:n]中，Ai是P[i-1] * P[i]矩阵
输出：矩阵链乘法相关子问题的最优代价矩阵M[][]和构造最优解信息的矩阵S[][]
1.  n = length(P[]) - 1; // 矩阵个数
2.  for(i=0; i<n; i++) Do M[i,i] = 0; // 一个矩阵连乘积的情况
3.  for(l=2; l<=n; l++) Do // 处理l个矩阵连乘积的情况
4.      for(i=0; i<n-l+1; i++) Do // 沿着对角线依次处理每行的元素
5.          j = i + l - 1;
6.          M[i, j] = ∞;
7.          for(k=i; k<j-1; k++) Do
8.              q = M[i,k] + M[k+1,j] + P[i-1]P[k]P[j];
9.              if q < M[i, j] Then M[i,j] = q; S[i,j] = k;

时间复杂度为 $O(n^3)$ ，空间复杂度为 $O(n^2)$ .

构造最优解

由于 $S [1] [n] = k$ 表明连乘积 $A_1·A_2·…·A_n$ 的最优乘法方案应按照 $A_1·A_2·…A_k)\ ·(A_{k+1}·A_{k+2}·…·A_{n})$ 进行，所以只需要递归地构造 $A_1·A_2·…A_k)$ 以及 $A_{k+1}·A_{k+2}·…·A_{n})$ 的乘法方案，并相应地进行合并即可。

0-1背包问题

定义

输入：物品重量 $w_1,w_2,…,w_n$ 及其价值 $v_1.v_2,…,v_n$ ，背包容量 $C$ ，其中 $w_i,v_i,C > 0$ .

输出：向量 $x_1,x_2,…,x_n>$ ，其中 $x_i∈\left\{0, 1\right\}$ ，使得 $\sum_{i=1}^nx_i·w_i \leq C$ 且 $\sum_{i=1}^nx_i·v_i$ 达到最大值。

分析优化子结构

如下简单的策略可以将0-1背包问题的求解过程转换成对子问题的处理。考察对第 1 个物品的处理，至多存在两种策略。策略一，将它不放入背包，即 $x_1=0$ ，此时仅需要将第 $2\sim n$ 个物品放入容量为 $C$ 的背包中，即求解子问题 $w_2,…,w_n;v_2,…,v_n;C>$ ；策略2，将它放入背包，即 $x_1 = 1$ ，此时仅需要将第 $\sim n$ 个物品放入容量为 $C - w_1$ 的背包中，确保不超重且物品价值达到最大，即求解子问题 $w_2,…,w_n;v_2,…,v_n;C-w_1>$ 。

如果 $x_1,x_2,…,x_n>$ 是0-1背包问题 $w_1,w_2,…,w_n;v_1,v_2,…,v_n;C>$ 的最优解，则 $x_2,x_3,…,x_n>$ 是 $w_2,…,w_n;v_2,…,v_n;C-x_1·w_1>$ 的最优解。

0-1背包问题具有优化子结构。问题的优化子结构意味着，可以先求解子问题 $w_2,…,w_n;v_2,…,v_n;C-x_1·w_1>$ 的最优解，然后处理第一个物品，根据是丢弃第一个物品还是将它放入背包会使整体方案中背包内物品总价值达到最大，决定 $x_1=0$ 或 $x_1=1$ 。

分析重叠子问题

由于背包容量是连续型变量，不易分析，但直观想，是存在重叠子问题的。

递归定义最优解的代价

重复上面产生子问题的过程，可以看到需要处理的子问题的一般形式是将第 $\sim n$ 个物品放入容量为 $j$ 的背包中，即处理子问题 $w_i,w_{i+1},…,w_n;v_i,v_{i+1},v_n;j>$ 。
由于 $\leq n, j \leq C$ ，故0-1背包问题需要处理的子问题共有 $n C$ 个。于是子问题空间的大小为 $O (n C)$ .

令 $b_{i,j}$ 表示子问题 $w_i,w_{i+1},…,w_n;v_i,v_{i+1},v_n;j>$ 的最优解的代价，即将第 $\sim n$ 个物品放入容量为 $j$ 的背包中取得的最大价值。将优化子结构应用于该子问题，需要处理的一个子问题为 $w_{i+1},…,w_n;v_{i+1},…,v_n; j>$ ，其代价为 $b_{i+1,j}$ ，需要处理的另一个子问题为 $w_{i+1},…,w_n;v_{i+1},…,v_n;j-w_i>$ （此时要求 $\geq w_i$ ），其代价为 $b_{i+1,j-w_{i}}$ 。由此，容易建立 $b_{i,j}$ 的如下递归式
$\begin{array}{ll} b_{n,j} = 0 & 如果\ j < w_n \\ b_{n,j} = v_n & 如果\ j \geq w_n \\ b_{i,j} = b_{i+1,j} & 如果\ j < w_i \\ b_{i,j} = max\left\{b_{i+1,j},v_i + b_{i+1,j-w_i}\right\} & 如果\ j\geq w_i \end{array}$

自底向上计算解的代价

根据最优解的代价方程，可以采用二维数组 $B [1 : n] [0 : C]$ 存储所有子问题的代价， $B [i, j]$ 记录子问题 $w_i,…,w_n;v_i,…,v_n;j>$ 的最优解的代价（这里指的是背包内物品最大价值）。

根据初始化条件，也就是仅考虑最后一件物品，有如下

$B [n, j] = 0$ ，其中 $\leq j < w_n$
$B[n,j]=v_n$ ，其中 $w_n \leq j \leq C$

为了避免子问题重复求解，在计算 $B [i, j]$ 之前，需要确保相关的子问题 $B [i + 1, j]$ 以及 $B[i+1,j-w_i]$ 已经被计算出来，这些问题恰好位于 $B [i, j]$ 的下一行。于是根据初始化条件，我们只需从第 $n$ 行开始，依次处理 $n - 1, n - 2, \dots, 2, 1$ 行，对每行的处理，只需要依次处理各列的子问题。

值得注意的是，这恰好是按照子问题规模递增的顺序进行处理，即先处理含1个物品的子问题，再处理含2个物品的子问题，再处理含3个物品的子问题，等等。

输入：正整数重量数组W[1:n]和正整数价值量数组V[1:n]，正整数容量C
输出：0-1背包问题所有相关问题的最优解代价数组B[1:n][0:C]
1.  n = W.length();
2.  For j from 0 to W[n] - 1 Do
3.      B[n][j] = 0;
4.  For j from W[n] to C Do
5.      B[n][j] = V[n];
6.  For i from n-1 to 2 Do   
7.      For j from o to W[i] - 1 Do
8.          B[i][j] = B[i+1][j];
9.      For j from W[i] to C Do
10.         B[i][j] = max(B[i+1][j-W[i]] + V[i], B[i+1][j]);
11. B[1][C] = max(B[2][C], v[1] + B[2][C-W[i]]);
12. return B;

构造最优解

构造最优解的信息同样也保存在了 $B [1 : n] [0 : C]$ 中。事实上，如果 $B [1] [C] = B [2] [C]$ ，说明第一个物品不在最优解中，依次类推。

0-1背包空间优化

参考。

空间优化，每一次 $b_{i,j}$ 的计算只与前一行的 $b_{i-1,j}$ 和 $b_{i-1,j-W_i}$ 相关，因此可以将 $d p$ 缩小成一维数组，从而达到优化空间的目的，状态转移方程变为：
$b_{j} = max\{\ b_{j},\ b_{j-W_i} + V_i\ \}$

注意，状态转移方程中 $b_j$ 需要用到它前面的值 $b_{j - W_i}$ ，所以一维数组中代价 $j$ 的扫描顺序应该是从大到小（ $C$ 到 $0$ ），否则处理前一个物品时保留下来的值将会被修改，从而造成错误。

动态规划总结

前面几个例子展示了动态规划求解问题的基本步骤，即先分析问题的优化子结构和重叠子问题，然后递归地定义最优解（或解的代价），再自底向上地求解所有相关子问题，最后构造最优解。

另一方面，我们不遗余力地强调动态规划算法设计的自然过程，即面对待求解的计算问题，尝试使用分治策略将问题求解转换为处理子问题，分析如何利用子问题的解来构造原问题的解从而产生优化子结构；再自然地基于简单的分治方法来处理，说明问题具有重叠子问题；继而分析分治过程中产生的子问题的空间，根据子问题的空间大小和形式来定义问题的解的代价，设计数据结构和计算顺序，最后得到求解问题的动态规划算法。而且，动态规划算法中的数据结构总是按需选用的，而非人为臆造；自底向上的计算次序也是根据数据结构和代价递归式自然地产生的，且自然地对应了按子问题规模递增的顺序求解所有子问题的顺序。

分析优化子结构和重叠子问题时，可以自顶向下地分析；在递归定义最优解或解的代价时，就需要自底向上的定义。

W24-

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Dynamic Programming——动态规划原理总结

动态规划原理分治算法的思想是将计算问题分解为规模较小的相似的子问题，然后分别求解这些子问题，再将子问题的解合并为原始问题的解。分治算法相对简单、直观、独立地处理各个子问题，而不对划分产生的子问题的特性和相互联系进行研究，导致了求解某些子问题的分治算法效率不高。“Dynamic Programming”中的“Programming”并非“编程”之意，而是“借助表格求解问题”的意思。动态规划采用分治的思想求解计算问题，并利用子问题之间的关联特性来提高计算效率，其计算过程依赖两个特征：优化子结构：如果优
复制链接

扫一扫