深度学习速通系列:动态规划算法

Ven%

已于 2024-09-12 22:35:21 修改

阅读量565

点赞数 3

分类专栏：深度学习速通系列文章标签： python 人工智能机器学习深度学习自然语言处理

于 2024-09-12 22:31:10 首次发布

本文链接：https://blog.csdn.net/weixin_51455837/article/details/142187427

版权

深度学习速通系列专栏收录该内容

17 篇文章 1 订阅

订阅专栏

动态规划（Dynamic Programming，简称DP）是一种算法策略，用于解决具有重叠子问题和最优子结构特性的优化问题。它是一种将复杂问题分解成更简单的子问题，并通过存储这些子问题的解（通常在一个表格中），避免重复计算，从而提高效率的方法。

动态规划的原理：

重叠子问题：动态规划适用于那些子问题会重复出现的问题。每次遇到子问题时，都计算其解并将其存储起来，之后再次遇到时直接使用。
最优子结构：一个问题的最优解包含其子问题的最优解。这意味着可以通过子问题的最优解来构建原问题的最优解。
无后效性：一旦某个状态被确定，它就不受之后决策的影响。这意味着你可以在不担心未来决策的情况下，独立地解决每个子问题。
记忆化：动态规划通常涉及两个过程，自顶向下的“记忆化”递归和自底向上的迭代。在记忆化递归中，每次解决子问题时都会检查是否已经计算过该子问题的解；如果是，则直接使用存储的解。

动态规划的基本步骤：

定义状态：确定dp数组的含义，每个元素dp[i]通常代表一个子问题的解。
确定状态转移方程：找出状态之间的关系，即如何从已知状态得到新状态。
确定初始状态和边界条件：初始化dp数组，确定算法的起点。
确定计算顺序：确定如何计算dp数组，通常采用自底向上的方法。

例子：0/1背包问题

问题描述：
假设你有一个背包，它能承载的最大重量为W。现在有n个物品，每个物品有一定的重量wi和价值vi，你需要选择一些物品装入背包，使得背包中物品的总价值最大，但总重量不超过W。

动态规划解法：

定义状态：dp[i][j]表示在前i个物品中，背包容量为j时的最大价值。
状态转移方程：
- 如果不选择第i个物品：dp[i][j] = dp[i-1][j]
- 如果选择第i个物品（前提是j >= wi）：dp[i][j] = dp[i-1][j-wi] + vi
- 综合两种情况：dp[i][j] = max(dp[i-1][j], dp[i-1][j-wi] + vi)
初始状态：dp[0][j] = 0 对所有j，因为没有物品时价值为0。
边界条件：dp[i][0] = 0 对所有i，因为背包容量为0时无法装任何物品。
计算顺序：按照i和j从小到大的顺序计算。

Python代码实现：

def knapSack(W, wt, val, n):
    dp = [[0 for x in range(W+1)] for x in range(n+1)]

    for i in range(1, n+1):
        for w in range(1, W+1):
            if wt[i-1] <= w:
                dp[i][w] = max(val[i-1] + dp[i-1][w-wt[i-1]], dp[i-1][w])
            else:
                dp[i][w] = dp[i-1][w]
    return dp[n][W]

# 物品重量
wt = [1, 3, 4, 5]
# 物品价值
val = [1, 4, 5, 7]
# 背包最大承载重量
W = 7
# 物品数量
n = len(wt)

print(knapSack(W, wt, val, n))