理解动态规划

最新推荐文章于 2022-04-17 12:20:52 发布

Sr's man

最新推荐文章于 2022-04-17 12:20:52 发布

阅读量247

点赞数

分类专栏：算法文章标签：动态规划算法 Python

本文链接：https://blog.csdn.net/qq_20966795/article/details/88600405

版权

算法专栏收录该内容

40 篇文章 0 订阅

订阅专栏

通常我们需要按照如下4个步骤设计一个动态规划的算法

刻画一个最优解的结构特征
递归地定义最优解的值
计算最优解的值，通常采用置底向上的方法
利用计算出的信息构造一个最有解

下面开始理解动态规划，从动态规划的钢条切割例子开始

1.钢条切割

长度i	1	2	3	4	5	6	7	8	9	10
价格 $p_{i}$	1	5	8	9	10	17	17	20	24	30

给定如上的的价格表，和一个长度为p的钢条，求出这个长度钢条以怎样的切割方案才可以获得最大利润？
下面给出切割钢条问题的递归解：
$r_{i}(i=1,2,...10)$ 表示长度为i的最大利润。
更一般的，我们构造如下的递归方程，对于 $r_{n}(n\geq1)$ ,我们可以用更短的钢条切割收益来描述它：
$r_{n} = max(p_{n},r_{1}+r_{n-1},r_{2}+r_{n-2},...,r_{n-1}+r_{1})$
$p_{n}$ :表示对于长度为n的钢条不切割可以获得的利润
其他你n-1个参数对应的另外n-1种方案，例如：对于 $r_{i}+r_{i-1}$ 表示将钢条切割成i和i+1两段，接着求解这两段的最佳切割收益 $r_{i}$ 和 $r_{n-i}$ .
我们发现求解 $r_{n}$ 可以变成求解 $r_{i}$ 和求解 $r_{i+1}$ 这两个子问题的组合所以说钢条切割问题满足最优子结构*性质：
问题的最优解由相关子问题的最优解组合而成，而这些子问题可以独立求解.

下面我们介绍另一种比较简单的递归求解方法：
将钢条分成左边的钢条和右边的钢条，左边钢条不再切割，而对右边的钢条进行递归切割。这样不做任何切割的方案可以描述为：左边长度为n，收益为 $p_{n}$ ,剩余部分长度为0，对应的收益 $r_{0} = 0$ 。我们可以用如下的公式来表示：
$r_{n} = \underset{l\leq i\leq n}{max}(p_{i}+r_{n-i})$

# 自顶向下的递归实现
p = [1,5,8,9,10,17,17,20,24,30]
n = len(p)
def cutRod(p,n):
    if n == 0:
        return 0
    q = -float('inf')
    for i in range(0,n):
        q = max(q,p[i]+cutRod(p,n-(i+1)))
    return q

cutRod(p,10)

CUT—ROD函数会反复的计算相同的子问题，例如对于cutRod(4)来说，我们可以生成如下的递归树：

                     4
                   /|\ \
                  / | | \
                 /  \  \ \
                3    2  1 0
               /|\   /\  \  
              / | \  1 0  0
             2  1  0 |
            /\       0
            1 0
            |
            0

当这个过程递归展开时，它所做的工作量会爆炸性的增长。

利用动态规划求解钢条切割问题。

如何利用动态规划优化钢条切割问题，即所有的子问题我们都只求解一遍，如果后来需要用到这个子问题的解，只需要查找保存的结果不需要再次计算。
动态规划有以下另种实现方法：

带备忘的自顶向下的方法：这个方法仍然按照自然的递归形式编写过程，这个过程会将求解得到的子问题的解保存在数组或者在哈希表中。如果需要到一个子问题的解是，只需要查找在数组或者哈希表中是否已经保存了这个子问题的解，如果有直接调用，如果没有，再递归的计算这个子问题。
自底向上的方法：这个方法一般需要定义子问题的规模。因为任何的子问题都需要计算更小的子问题，我们按照子问题的大小从小到大计算，当计算到某个子问题的时候，它所依赖的子问题都已经计算完成了。这样就可以保证，当我们第一次遇到这个子问题的时候，就是需要求解它的时候。

# 自顶向下的CUT-ROD过程的Python代码
def memoizedCutRod(p,n):
    r = [-float('inf')]*n
    return memoziedCutRodAux(p,n,r)
def memoziedCutRodAux(p,n,r):
    if r[n-1] >= 0:
        return r[n-1]
    if n == 0:
        q = 0
    else:
        q = -float('inf')
        for i in range(n):
            q = max(q,p[i]+memoziedCutRodAux(p,n-(i+1),r))
    r[n-1] = q
    return q

memoizedCutRod(p,10)

# 自底向上的方法
def bottomUpCutRod(p,n):
    r = [0]*n
    for j in range(n):
        q = -float('inf')
        for i in range(j+1):
            q = max(q,p[i]+r[j-(i+1)])
        r[j] = q
    return r[-1]

bottomUpCutRod(p,10)

求斐波那契数列的第n项：
$F_{0} = 0 \\ F_{1} = 1 \\ F_{n} = F_{n-1}+F_{n-2}$

def focb(n):
    res = [0]*(n+1)
    res[1] = 1
    for i in range(2,n+1):
        res[i] = res[i-1]+res[i-2]
    return res[-1]

focb(4)

2.矩阵链乘法

首先给出一个矩阵相乘的方法。
属性rows和columns是矩阵的行数和列数。

import numpy as np
def matrixMut(A,B):
    rowsA = len(A)
    colsA = len(A[0])
    rowsB = len(B)
    colsB = len(B[0])
    if colsA != rowsB:
        raise Exception("incompatible dimensions")
    else:
        C = [[0 for _ in range(colsB)] for _ in range(rowsA)]
        for i in range(rowsA):
            for j in range(colsB):
                for k in range(colsA):
                    C[i][j] += A[i][k] * B[k][j]
    return C

A = np.random.randint(0,10,(4,3))
B = np.random.randint(0,10,(3,4))
C =  matrixMut(A,B)
C1 = np.dot(np.mat(A),np.mat(B))

[[24, 84, 84, 115], [46, 56, 96, 80], [43, 112, 127, 152], [37, 84, 101, 119]]

C1

matrix([[ 24,  84,  84, 115],
        [ 46,  56,  96,  80],
        [ 43, 112, 127, 152],
        [ 37,  84, 101, 119]])

上面是矩阵相乘的程序，并且用numpy的矩阵相乘函数np.dot()检验。
我们发现对于一个矩阵相乘例如： $lt;A_{1}, A_{2}>$ ,他们的规模分别为10×100、 100*5.那么我们要做的标量乘法就是 $10\cdot 100 \cdot 5$ 次。
对于一个矩阵链乘，会有不同的括号化方案，对应的不同的标量乘法次数。我们要找到一种括号化方案，似的矩阵的链乘积的标量乘法次数最少。

利用暴力法分析问题规模。

如果利用暴力法，那么我们就需要计算所有的括号化方案，来找到一个标量乘法次数最少的一个括号化方案，那么用P(n)来表示，那矩阵链的长度为n时，的
括号化的方案数。那么我们就有如下的递归方程。
$\left\{\begin{matrix} 1 & if\; n==1 \\ \sum ^{n-1}_{k=1}P(k)P(n-k) & if\; n\geq 2 \end{matrix}\right.$
这个递归式的结果为 $\omega (2^n)$ ,这是一种糟糕的策略。

应用动态规划的方法

利用我们一开头就提到的应用动态规划的步骤。

刻画一个最优的子结构
构造递归式
计算最有解通常使用自底向上的方法
(如必要)根据计算的信息构造一个最优解。

第一步那就是找到一个最优的子结构了。

对于 $A_{i}A_{i+1}...A{j}$ ,对其进行括号化，加入我们在矩阵 $A_{k}$ 的后边添加一个")"那么我们下一步就要计算前边半条矩阵链相乘得到矩阵 $A_{i,k}$ 的代价，加上后边矩阵链相乘得到矩阵 $A_{k+1,j}$ 的代价，然后加上这两个矩阵相乘的代价，这就是全部的代价。
那么最优子结构就是对于 $A_{i}A_{i+1}...A{j}$ ，找到他的最优去括号化方案，将其分成两段，其中前段是 $A_{i}A_{i+1}...A{k}$ ,那么单独求这半个的链的最优括号化方案，如果将这个方案放在整个链中也是最优的括号化方案。这个原因可以用剪切–粘贴技术证明：

假如我们有一个矩阵链 $A_{i}A_{i+1}...A{j}$ ：它的最优括号化方案的分割点在k
方案一：将其分成两段， $A_{i}A_{i+1}...A{k},A_{k+1}A_{k+2}...A{j}$ ,我们分别单独求其的最优括号化方案，得到了:

$A_{i}A_{i+1}...A{k}$ , $A_{k+1}A_{k+2}...A{j}$ (这里我们用不同的颜色来表示最优的括号化方案。)
将这两段拼接起来就是整体链的最佳括号化方案。

方案二：如果我们直接求这个整体链的最佳括号化方法，得到如下的最佳方案。

$A_{i}A_{i+1}...A{k}$ $A_{k+1}A_{k+2}...A{j}$

接下来我们将这个方案二的紫色的前一段 $A_{i}A_{i+1}...A{k}$ 提取出来，现在我们假设这一段不是 $A_{i}A_{i+1}...A{k}$ 的最优解，也就是说 $A_{i}A_{i+1}...A{k}$ 这个方案，比方案 $A_{i}A_{i+1}...A{k}$ ,代价更高。那么我们将 $A_{i}A_{i+1}...A{k}$ 这一段添加到方案二中得到：
$A_{i}A_{i+1}...A{k}$ $A_{k+1}A_{k+2}...A{j}$
显然这个是更优的解，所以就证明了方案二是不成立的。

构造递归式

用m[i,j]来表示计算矩阵 $A_{i..j}$ 所需要的最小标量乘法。
对于i==j的情况只有一个矩阵必然有m[i,j]=0,而对于i<j的情况，假设最佳分割点在矩阵 $A_{k}$ 和 $A_{k+1}$ 之间，那么我们就可以写出如下的递归式：
$m[i,j] = m[i,k] + m[k+1,j] + p_{i-1}p{k}p{j}$
而实际中我们不知道k是多少，这里k的取值一共有j-i种可能，即 $k = i, i + 1, . . ., j$ ,我们遍历这些情况找到最佳的k值。所以递归式为：
$\left\{\begin{matrix} 0 & if\; i==j\\ \underset {i\leq k < j} {min} \{ m[i,k], m[k+1,j] + p_{i-1}p_{k}p_{j}\} & if\; i < j \end{matrix}\right.$

计算最优代价

假定矩阵 $A_{i}$ 的规模是 $p_{i-1} \times p{i},\;(i=1,2,...,n)$ ，他的输入是一个维度序列， $lt;p_{0},p_{1},...p_{n}>$ ,这个过程用一个辅助表m[i,j]保存计算代价，而用s[1,…n-1,2…n]记录切割位置，以此来构造最优解。
为了采用自底向上的方法，我们必须确定计算m[i,j],会用到那些子问题，j-i+1个链相乘只依赖于那些比它短的链相乘的代价。
例如计算 $A_{1,3}$ 的代价，他的长度为3，我们会用到链中所有长度小于3的链乘积代价，那么计算 $A_{1,4}$ ,我们就会用到所有长度小于4的链的乘积代价，我们可以发现，我们可能会计算相同的子问题，这种子问题的重叠性也是动态规划的另一个标识。
那么我们采用自底向上的方法，我先解决规模最小的子问题，当我们需要解规模较大的子问题时，它所以依赖的较小子问题我们都已经解出来了，直接调用即可。所以我们就应该按照链的长度的递增顺序解决这个问题。

# 矩阵链乘积
def matrixChainOrder(p):
    n = len(p)-1
    m = [[0]*(n) for _ in range(n)]
    s = [[0]*(n-1) for _ in range(n-1)]
    for l in range(1,n):
        for i in range(n-l):
            j = i + l
            m[i][j] = float('inf')
            for k in range(i,j):
                q = m[i][k] + m[k+1][j] + p[i]*p[k+1]*p[j+1]
                if q < m[i][j]:
                    m[i][j] = q
                    s[i][j-1] = k+1
    return m,s

p = [30,35,15,5,10,20,25]
m,s = matrixChainOrder(p)

m,s

([[0, 15750, 7875, 9375, 11875, 15125],
  [0, 0, 2625, 4375, 7125, 10500],
  [0, 0, 0, 750, 2500, 5375],
  [0, 0, 0, 0, 1000, 3500],
  [0, 0, 0, 0, 0, 5000],
  [0, 0, 0, 0, 0, 0]],
 [[1, 1, 3, 3, 3],
  [0, 2, 3, 3, 3],
  [0, 0, 3, 3, 3],
  [0, 0, 0, 4, 5],
  [0, 0, 0, 0, 5]])

最后构造最优解

目前我们可以求出一个矩阵链乘的最小代价，但是我们还不能显示出最优的括号化方案，求得的s,s[i,j]保存的就是从矩阵 $A_{i}$ 到矩阵 $A_{j}$ 加入“)”的位置。我们可以递归的加入"()"

def printOptParens(s,i,j):
    if i==j:
        print("A{}".format(str(i+1)),end="")
    else:
        print("(",end="")
        printOptParens(s,i,s[i][j-1]-1)
        printOptParens(s,s[i][j-1],j)
        print(")",end="")

printOptParens(s,0,5)

((A1(A2A3))((A4A5)A6))

1,对矩阵规模序列<5,10,3,12,5,50,6>,求矩阵链最优括号化方案

p = [5,10,3,12,5,50,6]
m,c = matrixChainOrder(p)

m,c

([[0, 150, 330, 405, 1655, 2010],
  [0, 0, 360, 330, 2430, 1950],
  [0, 0, 0, 180, 930, 1770],
  [0, 0, 0, 0, 3000, 1860],
  [0, 0, 0, 0, 0, 1500],
  [0, 0, 0, 0, 0, 0]],
 [[1, 2, 2, 4, 2],
  [0, 2, 2, 2, 2],
  [0, 0, 3, 4, 4],
  [0, 0, 0, 4, 4],
  [0, 0, 0, 0, 5]])

printOptParens(c,0,5)

((A1A2)((A3A4)(A5A6)))

设计递归算法MATRIX-CHAIN-MULTIPLY(A,s,i,j),实现矩阵链乘的算法。

def matrixChainMut(A,s,i,j):
    if i==j:
        return A[i]
    if i==j+1:
        return matrixMut(A[i],A[j])
    else:
        B1 = matrixChainMut(A,s,i,s[i][j-1]-1)
        B2 = matrixChainMut(A,s,s[i][j-1],j)
        return matrixMut(B1,B2)

# 根据维度链生成一系列随机矩阵
def randomMatrixs(p):
    matrixs = list()
    for i in range(len(p)-1):
        matrixs.append(np.random.randint(0,10,(p[i],p[i+1])))
    return matrixs

matrixs = randomMatrixs(p)

matrixChainMut(matrixs,s,0,5)

[[685009380, 681729124, 741674364, 597968918, 622221146, 737326806],
 [574114480, 571367532, 621146920, 500886252, 521416180, 617575464],
 [741957590, 738384282, 803052608, 647465550, 673855082, 798375320],
 [920582443, 916179757, 996816790, 803671532, 836228448, 990964623],
 [959841592, 955230604, 1038517360, 837402704, 871703472, 1032528964]]

Sr's man

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
理解动态规划

通常我们需要按照如下4个步骤设计一个动态规划的算法刻画一个最优解的结构特征递归地定义最优解的值计算最优解的值，通常采用置底向上的方法利用计算出的信息构造一个最有解下面开始理解动态规划，从动态规划的钢条切割例子开始1.钢条切割长度i12345678910价格pip_{i}pi1589101717202430给定如上的...
复制链接

扫一扫

专栏目录