Python 算法之动态规划详解

最新推荐文章于 2024-08-20 20:48:31 发布

XianZhe_

最新推荐文章于 2024-08-20 20:48:31 发布

阅读量1.5w

点赞数 79

分类专栏： Python 算法文章标签： python 动态规划算法

本文链接：https://blog.csdn.net/XianZhe_/article/details/114962984

版权

Python 同时被 2 个专栏收录

37 篇文章 20 订阅

订阅专栏

算法

8 篇文章 1 订阅

订阅专栏

Python 算法之动态规划

文章目录

Python 算法之动态规划

动态规划是个啥🤔

动态规划（Dynamic Programming），简写为 DP，是寻找多分支下最优解的过程

动态规划工作原理：
先解决相对简单的子问题，再逐步解决大问题

根据下面这些问题，来了解一下什么是动态规划🙄

动态规划经典问题🤓

背包问题

背包问题¹ 是动态规划中中一个很经典的问题，这个问题生动有趣，所以我放在第一个来讲

假设张三要去野营，他准备了以下物品：

物品	重量	价值
水	3斤	10
书	1斤	3
食物	2斤	9
小刀	3斤	4
衣物	2斤	5
手机	1斤	10

每样东西都有相应的价值，可呆呆的他在收拾背包时发现，他的背包 最大容量只有6斤，装不下所有的东西，只能从这堆东西中挑选组合价值最高的物品

关键点

约束条件： 将背包的容量大小(承重)划分成不同容量大小的子背包，计算每个子背包的最大价值
物品重量不能超过当前背包容量，不可能将重量为5斤的物品放进容量为2斤的背包里，机器可不能像人一样会自己识别大小，这看起来可笑的问题确实会发生，得加上判断语句

背包问题
只能拿一次物品的情况下

每个子问题取得一次物品，就不能再取相同的物品，要么这个要么这个，拿了就没
比如此时 背包容量为6斤，拿了一瓶水后 占用了背包容量3斤，剩余容量为3斤 我要么再拿一本书和一件衣服(1+2)，要么再拿食物和一部手机(2+1)等，不可能再去拿一瓶水

def dynamic_p() -> list:
    items = [  									 # 物品项
        {"name": "水", "weight": 3, "value": 10},
        {"name": "书", "weight": 1, "value": 3},
        {"name": "食物", "weight": 2, "value": 9},
        {"name": "小刀", "weight": 3, "value": 4},
        {"name": "衣物", "weight": 2, "value": 5},
        {"name": "手机", "weight": 1, "value": 10}
    ]
    max_capacity = 6                             # 约束条件为 背包最大承重为6
    dp = [[0] * (max_capacity + 1) for _ in range(len(items) + 1)]

    for row in range(1, len(items) + 1):         # row 代表行
        for col in range(1, max_capacity + 1):   # col 代表列
            weight = items[row - 1]["weight"]    # 获取当前物品重量
            value = items[row - 1]["value"]      # 获取当前物品价值
            if weight > col:                     # 判断物品重量是否大于当前背包容量
                dp[row][col] = dp[row - 1][col]  # 大于直接取上一次最优结果 此时row-1代表上一行
            else:
                # 使用内置函数max()，将上一次最优结果 与 当前物品价值+剩余空间可利用价值 做对比取最大值
                dp[row][col] = max(value + dp[row - 1][col - weight], dp[row - 1][col])
    return dp


dp = dynamic_p()
for i in dp:                                     # 打印数组
    print(i)

print(dp[-1][-1])                                # 打印最优解的价值和

可重复拿取物品的情况下

先思考一个问题，为什么上面的代码可以不重复拿去？
那是因为，我们是根据 当前物品的价值+剩余空间的价值 来更新最优解，可这个剩余空间价值是通过上一行来获取的，并未加上当前的商品价值，因此只需要加上当前的商品价格作为参考，即在当行获取最优解

def dynamic_p() -> list:
    items = [  									 # 物品项
        {"name": "水", "weight": 3, "value": 10},
        {"name": "书", "weight": 1, "value": 3},
        {"name": "食物", "weight": 2, "value": 9},
        {"name": "小刀", "weight": 3, "value": 4},
        {"name": "衣物", "weight": 2, "value": 5},
        {"name": "手机", "weight": 1, "value": 10}
    ]
    max_capacity = 6                             # 约束条件为 背包最大承重为6
    dp = [[0] * (max_capacity + 1) for _ in range(len(items) + 1)]

    for row in range(1, len(items) + 1):         # row 代表行
        for col in range(1, max_capacity + 1):   # col 代表列
            weight = items[row - 1]["weight"]    # 获取当前物品重量
            value = items[row - 1]["value"]      # 获取当前物品价值
            if weight > col:                     # 判断物品重量是否大于当前背包容量
                dp[row][col] = dp[row - 1][col]  # 大于直接取上一次最优结果 此时row-1代表上一行
            else:
                # row-1 为上一行，row为本行，若要重复拿取，只需要在目前物品所在的那一行寻找最优解即可
                dp[row][col] = max(value + dp[row][col - weight], dp[row - 1][col])
    return dp


dp = dynamic_p()
for i in dp:                                     # 打印数组
    print(i)

print(dp[-1][-1])                                # 打印最优解的价值和

可以看到，创建二维数组的时候，行列数都加了一🙄

每个单元格的取值，要么是来自 上一 CELL(单元格) 的值，要么来自 当前物品的价值+剩余容量价值，这些取值都离不开上一行的最优解值，可二维数组中第一行的每一个单元格(即子问题) ，都没有上一个 CELL 的值，那就需要在第一行前再插入每个 CELL 都为0的一行
数组的索引从0开始，1的索引在数组第二个位置，为方便编写和理解，多增一行一列，索引为0的行列不做变动

背包问题带占位0

根据背包问题可以得到以下启示😮

二维数组(网格、DP Table)： 每个 CELL 都是一个子问题，要考虑如何将问题分解成一个个子问题，每个子问题的最优解存储在 CELL 里
动态规划没办法处理只拿物品的一部分，要么全部拿走，要么不拿
行的排列顺序对结果的影响无关紧要

如图所示最后的最优解都是 29
问题的最优解不一定要把背包装满
如果遇到一个物品的价值比其他物品都要高时，那肯定会装下此物品，可在装下此物品后剩余空间不足于再装下其他物品，就会出现背包没装满的情况
如现有背包容量的最大容量还是为 6斤，有个 5.5斤重，价值为100的物品，这个物品比其他所有物品价值都要高，装上背包后，剩余 0.5斤容量别的什么都装不下

子串、子序列又是啥🤔

子串²、子序列³，一句话概括两者区别：字串一定是连续的，而子序列

最长递增子序列

最长递增子序列 ( longest increasing subsequence )⁴，简写为 LIS

指的是在一个给定的数值序列中，找到一个子序列，使得这个子序列元素的数值依次递增，且这个子序列长度是最长的
给定一个数组，nums = [6, 10, 9, 2, 3, 6, 10, 661, 66]，这个数组的最长递增子序列是 [2, 3, 6, 10, 66]，算法中的输出结果应为 5

关键点：

最简单的情况下（base case），最短的子序列应该为自己，即为 1
如何根据dp[ i ] 前面的结果来推出 dp[[ i ] 呢？
加一个循环，遍历 nums[ i ] 前面的值，如果存在比 nums[ i ] 小的值，则继承 dp[ i ] 上的结果并加一
需要注意的是：比 nums[i] 小的子序列可能不只一个，需要继承的是最大值
```
for k in range(i):
    if nums[i] > nums[k]:
        dp[i] = max(dp[i], dp[k]+1)    
```

最长递增子序列

结合上述内容，完整代码为👇🏻

def length_lis(nums: list) -> int:
    length = len(nums)                       # 获取nums数组长度
    dp = [1] * length                        # 定义 dp table
    for i in range(len(nums)):
        for k in range(i):
            if nums[i] > nums[k]:            # 寻找前面那些比当前数值小的子序列
                dp[i] = max(dp[i], dp[k]+1)  # 比当前数值小的数可能不只一个，取最大值
    return max(dp)                           # 最大的值就是最长的子串

nums = [6, 10, 9, 2, 3, 6, 10, 661, 66]
print(length_lis(nums))

DP Table 的维度

可以看到，这里关于递增的问题使用到的都是一维数组，而最开始讲到的背包问题却使用了二维数组

数组维度并非是固定的，要根据问题提供数据的复杂度来选择 DP Table 的数组维度

最长公共子串、子序列

最长公共子串⁵

最长公共子串（Longest common substring）

是寻找两个或多个已知字符串最长的子串
此问题与最长公共子序列问题的区别在于 子序列不必是连续的，而子串却必须是
最长公共字串

这里有两个字符串，分别是 bear 和 beear，他们两的最长公共子串值是多少呢？🙄

def dynamic_p(s1, s2) -> list:
    r, c = len(s1), len(s2)
    dp = [[0] * (c+1) for _ in range(r+1)]
    for row in range(r):
        for col in range(c):
            if s1[row] == s2[col]:
                dp[row+1][col+1] = dp[row][col] + 1    # 对左上角CELL值+1
            else:
                # 匹配不成功清0，这里可以不用到else，因为默认值就为0
                dp[row+1][col+1] = 0
    return dp


arr = []
dp = dynamic_p("bear", "beear")

for i in dp:
    arr.extend(i)
    print(i)                                           # 打印数组

print(f"最长公共子串为:{max(arr)}")

当匹配成功时，此时单元格的值应为左上角CELL的值加一
匹配不成功时，应当为零

如何理解 DP[i-1][j-1] + 1

如 beear 和 bear，此时 b 为 e 的上一个字符，若e匹配成功了，那就检查它的上一个字符 b 有没有匹配成功，上一个字符 b 在左上角单元格的位置，若 b 也匹配成功了，那在此基础上加一，保存连续的记录状态

在这里插入图片描述

最长长公共子序列⁶

最长公共子序列（Longest Common Subsequence），简写为 LCS

是在一个序列集合中（通常为两个序列）用来查找所有序列中最长子序列的问题，
这与查找最长公共子串的问题不同的地方是：子序列不需要在原序列中占用连续的位置。

说人话就是

计算两个字符串中能连在一块字符的最长长度

比如输入 str1="abcdefg" ，str2="edge"，其中最长的公共子序列为 [e, g]，算法应输出 2

比起获取最长公共子串，获取最长公共子序列，容易想到是暴力方法

def dynamic_p(s1, s2) -> int:
    res = set()                 # 利用集合进行去重
    for i in s1:
        for k in s2:
            if i == k:
                res.add(k)
    return len(res)


print(dynamic_p("beear", "bear"))

如何使用动态规划

要记住动态规划原理是：先解决相对简单的子问题，再逐步解决大问题

那如何将问题划分成子问题呢？约束条件又是什么？

将字符串 s1 和字符串 s2 拆开，如 “b” 与 “be”、“b” 与 “bea”、“b” 与 “bear” 的最长公共子序列，这就是一个个子问题，将其表现为二维数组(网格)，为下图所示👇

最长公共子序列空网格

关键点：

DP[1][2] = 1 代表 “be” 与 “b” 的最长公共子序列为 1，DP[3][2] = 2 代表 “be” 与 “bea” 的最长公共子序列为 2，DP[3][2] = 2 代表 “bee” 与 “bea” 的最长公共子序列为 2
最简单的情况(base case) 是没有公共子序列，即为 0

在这里插入图片描述

def dynamic_p(s1, s2) -> list:
    r, c = len(s1), len(s2)
    dp = [[0] * (c+1) for _ in range(r+1)]
    for row in range(r):
        for col in range(c):
            if s1[row] == s2[col]:
                dp[row+1][col+1] = dp[row][col] + 1     # 上一个字符串最长公共子序列再加一
            else:
                # 在左方CELL和上方CELL中选择 子问题中最长公共子序列 较长的那个 
                dp[row+1][col+1] = max(dp[row+1][col], dp[row][col+1])
    return dp


dp = dynamic_p("bear", "beear")                         # 打印数组
for i in dp:
    print(i)

print(f"最长公共子序列为:{dp[-1][-1]}")

最长公共子序列网格

给出题目

由于篇章实在过长，这里将每个问题分为单独的一篇博客🙄

最大子数值问题

输入一个整型数组，数组中的一个或连续多个整数组成一个子数组，求所有子数组的和的最大值

比如输入 nums = [-2,1,-3,4,-1,2,1,-5,4]，其中的最大子数组是 [4,-1,2,1]，算法应当输出 6

注意：
此问题要求计算子数组的最大和，而子数组一定是连续的，这就是为什么上面的示例最大子数组中有个 -1，而不把除了负数之外的值全部加起来，为获取最大子数组和，那就得经过 -1

此问题与此前提到的最长递增序列比较类似

Python 算法题之子数组的最大和

俄罗斯套娃信封

有一个二维整数数组 envelopes ，其中 envelopes 中的每个值代表着一个信封，每个信封的宽度和高度以整数对 [ w, h ] 表示，当另一个信封的宽度和高度都比这个信封大的时候，这个信封就可以放进另一个信封里，如同俄罗斯套娃一样
计算最多有多少个信封能组成一组 “俄罗斯套娃” 信封

比如输入 envelopes = [[5,4],[6,4],[6,7],[2,3]]，能组成最多套娃信封组是 [2,3] => [5,4] => [6,7]，算法应当输出 3

Python 算法题之俄罗斯套娃信封

不同子序列

给定一个字符串 s 和一个字符串 t ，计算在 s 的子序列中 t 出现的个数。
简单来说就是：从 s 字符串上挑字符，求能匹配 t 字符串的次数是多少

比输入 s="beear"，t="bear ，其中从 s 身上挑字符，能匹配 t=bear 的方式有两种，算法应当输出 2

Python 算法题之不同子序列

总结

个人感觉动态规划难以理解的原因有这些🤧

结构庞杂，需要将问题划分成一个个子问题，每个子问题分别运算，先解决相对简单的子问题，再逐步解决大问题，最后求最优解
要充分结合问题设计出动态规划解决方案(状态转移方程)是最困难的部分
如何去设计 DP Table，问题最简单的情况(base case)是什么，每个子问题能做出什么选择发生改变

动态规划所带来的启示🤪

在问题可分解为彼此独立且离散的子问题时，在给定约束条件下，就能够使用动态规划来设计解决方案
每中动态规划方案背后都有着网格，如上面所展示的一系列图，每个格都是一个个子问题
动态规划先解决相对简单的子问题，再逐步解决大问题
可以先确定最简单的情况 (base case) 和最终答案在 DP 中的位置，再尝试找出状态转移方程

动态规划思路流程

先设计出DP Table，并明确其含义
找到问题最简单(base case)的情况是什么
寻找设计出状态转移方程

动态规划是一个难以理解算法概念，这是真的，但愿上述内容能够帮得上忙🥶

有个更简单的例子：斐波纳契数列，其用到的伪动态规划的解法不妨去看看

后记

动态规划是一个难以理解算法概念，但深入研究时会发现动态规划还是有点意思的，让人又爱又恨，为了研究什么是动态规划，以及如何去实现，我查阅大量的资料，花费大量时间学习，在此期间我十分感谢网上大佬们各种各样的文章，给我一定的启发，我决定写下这篇笔记分享给大家。

我是个不折不扣的新手，文章内容或许存在不足、错误，这里请大家谅解，比起博客我更喜欢称呼这为笔记。

此笔记会持续更新、改进（还未写完），要是有路过的大佬可以指出我的错误，我会感到高兴，十分感谢😋

参考资料

在攻克动态规划算法时，我十分感谢这些帮助过我的资料、书籍，可以说没有它们的帮助，我难以啃动动态规划这块硬骨头，再次感谢书写这些资料、书籍的作者们

在这里我把这些资料、书籍给列出来，欢迎大家去查看，书籍可以在京东上能够买到

题目出之力扣：
- 不同子序列 leetcode 115
维基百科中文版：
- 动态规划概念
书籍：
- 图灵程序设计丛书《算法图解》
  这是一本很棒的算法入门书，推荐给大家
- labuladong大佬著作的《labuladong 的算法小抄》
  这是一本很厉害的书，十分推荐