动态规划通常用来解决最优化问题,通过做出一组选择来达到最优解。在做出每个选择的同时,通常会生成与原问题形式相同的子问题。当多于一个选择子集都生成相同的子问题时,动态规划技术通常就会很有效,其关键技术就是对每个这样的子问题都保存其解,当其重复出现时即可避免重复求解。
基本概念
动态规划(dynamic programming)与分治方法相似,都是通过组合子问题的解来求解原问题。分治方法将问题划分为互不相交的子问题,递归的求解子问题,再将他们的解组合起来,求出原问题的解。与之相反,动态规划应用于子问题重叠的情况,不同的子问题具有公共的子子问题。在这种情况下,分治算法会做许多不必要的工作,它会反复地求解那些公共子问题,而动态规划算法对每个子子问题只求解一次,将其解保存在一个表格中,从而无需每次求解一个子子问题时都重新计算,避免了这种 不必要的计算工作。
动态规划常用来求解最优化问题(optimization problem),这类问题可以有很多可行解,每个解都有一个值,寻找最优值(最大值或最小值)的解,称这样的解为问题的一个最优解(an optimal solution),而不是最优解(the optimal solution),因为有可能有多个解都达到最优值。
通常用4个步骤来设计一个动态规划算法:
1. 刻画一个最优解的结构特征;
2. 递归的定义最优解的值;
3. 计算最优解的值,通常采用自底向上的方法;
4. 利用计算出的信息构造一个最优解 。
钢条切割
问题描述
钢条切割问题:给定一段长度为n英寸的钢条和一个价格表pi(i=1,2,•••,n),求切割钢条方案,使得销售收益rn最大,钢条可以0切割。
最优解的结构特征
长度为n英寸的钢条共有2^(n-1)中不同的切割方案,因为在距离钢条左端i(i=1,2,•••,10)英寸出,我们总是可以选择切割或不切割。一个最优解就是将钢条切割为k段(1<=k<=n),那么最优切割方案为
n=i1+i2+•••+ik
将钢条切割为长度分别为i1,i2,•••,ik的小段,得到最大收益
rn=pi1+pi2+•••+pik
更一般的,对于rn,可以用更短的钢条的最优切割收益来描述它
rn=max(pn,r1+r(n-1),r2+r(n-2),•••,r(n-1)+r1)
递归定义最优解
根据上面得到的式子,采用递归的方法,伪代码如下:
CUT_ROD(p, n)
if n == 0
return 0
q = -1
for i = 1 to n
q = max (q, p[i] + CUT_ROD(p, n - i)
return q
从上面的递归中可以看出,每个n值,都会反复的计算前面已经计算过的值,当n比较大时,递归调用的工作量会爆炸性的增长,所以应该采用动态规划的方法求解。
自底向上计算最优解的值
动态规划有两种等价的实现方法。
第一种方法称为带备忘的自顶向下法(top-down with memorization)。此方法仍按照自然的递归形式编写过程,但过程会保存每个子问题的解(通常保存在一个数组或哈希表中),我们称这个递归过程是带备忘的(memoized)。
第二种方法称为自底向上法(bottom-up method)。这种方法一般需要恰当定义子问题“规模”的概念,使得任何自问的求解都只依赖于“更小的”子问题的求解,因而可以将子问题按规模排序,按由小至大的顺序进行求解。
两种方法得到的算法具有相同的渐进运行时间,仅有的差异是在某些特殊情况下,自顶向下方法并未真正递归地考察所有可能的子问题,由于没有频繁的递归函数调用的开销,自底向上方法的时间复杂性函数通常具有更小的系数。
这里采用第二种方法的伪代码如下:
BOTTOM_UP_CUT_ROD(p, n)
let r[n] be a new array
r[0] = 0
for j = 1 to n
q = -1
for i = 1 to j
q = max(q, p[i] + r[j – i])
r[j] = q
return r[n]
构造最优解
上面的伪代码已经计算出最优解的值,但缺少最优解的方案,可以稍加修改,添加数组s记录n英寸钢条最优切割方案的第一段切割长度:
EXTENDED-BOTTOM-UP-CUT-ROD(p, n)
let r[n] and s[n] be new arrays
r[0] = 0
for j = 1 to n
q = -1
for i = 1 to j
if q < p[i] + r[j – i]
q = p[i] + r[j – i]
s[j] = i
r[j] = q
return r and s
通过下面的伪代码来输出完整的最优切割方案:
PRINT_CUT_ROD_SOLUTION(p, n)
(r, s) = EXTENDED-BOTTOM-UP-CUT-ROD(p, n)
while n > 0
print s[n]
n = n – s[n]
矩阵链乘法
问题描述
给定n个矩阵的链[A1,A2,•••,An],矩阵Ai的规模为p(i-1)*pi(1<=i<=n),求完全括号化方案,使得计算乘积A1A2•••An所需标量乘法次数最少。
最优解的结构特征
和钢条切割问题相似,A1A2•••An其实就可以写成A1•••AkA(k+1)•••An,其中A1•••Ak和A(k+1)•••An就成为了两条子链,同理,子链亦可往下分解,原来的问题就变成了求解这些子链的的问题。
递归求解方案
令m[i, j]表示计算矩阵链所需标量乘法次数的最小值,原问题的最优解的值为m[1, n],很容易,我们得到
m[i, j] = m[i, k] + m[k+1, j] + p(i-1)pkpj,当i=j时,m[i , j]=0.
计算最优解的值
根据上面的递归公式,假设矩阵Ai的规模为p(i-1)*pi,它的出入序列是p=[p0,p1,•••,pn],过程中用辅助表m保存代价m[i, j],用辅助表s记录最优值m[i, j]对应的分割点k。伪代码如下:
MATRIX_CHAIN_ORDER(p)
n = p.length – 1
let m[n+1][n+1] and s[n][n+1] be new tables
for i = 1 to n
m[i, i] = 0
for i =2 to n
for i = 1 to n-l+1
j = i + l – 1
m[i , j] = -1
for k = i to j-1
q = m[i, k] + m[k+1, j] + p(i-1)pkpj
if m[i, j] < 0 or q < m[i, j]
m[i, j] = q
s[i, j] = k
return m and s
构造最优解
利用递归求解的思路递归的输出最优括号方案,伪代码如下:
PRINT_OPTIMAL_PARENS(s, i, j)
if i == j
return “A”i
else
print “(“
PRINT_OPTIMAL_PARENS(s, i, s[i, j])
PRINT_OPTIMAL_PARENS(s, s[i, j] + 1, j)
print “)”