数据结构与算法-进阶（二十）动态规划

最新推荐文章于 2022-11-03 10:15:00 发布

我为双鱼狂

最新推荐文章于 2022-11-03 10:15:00 发布

阅读量162

点赞数

分类专栏：数据结构与算法文章标签：动态规划算法数据结构

本文链接：https://blog.csdn.net/weixin_43636096/article/details/125341782

版权

数据结构与算法专栏收录该内容

53 篇文章 14 订阅

订阅专栏

摘要

动态规划是求解最优化的一种常用策略，它依然需要拆分成若干个子问题，但是每个子问题只有求解一次，并保存它的解。可以用动态规划解决的问题需要有最优子结构和无后效性两个特定。

动态规划简称 DP，是求解最优化问题的一种常用策略。动态规划通常使用的套路大致分为这三种：

暴力递归，自顶向下，会出现重叠子问题；
记忆搜索，自顶向下；
递归，自底向上。

假设动态规划的函数为 dp()，其中的“动态”可以理解是“状态是会变化的”，动态规划的处理通常有以下三个步骤：

定义状态，就是原问题和子问题的解，也就是定义 dp(i) 的含义；
设置初始状态，也就是边界，作为 DP 的结束条件，即设置 dp(0) 的值；
确定状态转移方程，比如确定 dp(i) 和 dp(i-1) 的关系。

动态规划的英文释义：
Dynamic Programming is a method for solving a complex problem by breaking it down into a collection of simpler subproblems, solving each of those subproblems just once, and storing their solutions.

根据上面的释义可以梳理出动态规划的执行步骤：

将复杂的原问题拆解成若干个简单的子问题；
每个子问题仅仅解决1次，并保存这些子问题的解；
最后推导出原问题的解。

所以使用动态规划解决的问题，需要具有以下两个特点：

最优子结构，就是通过求解子问题的最优解，可以获得原问题的最优解；
无后效性，某个阶段的状态一旦确定，则此后过程的演变不再受到此前各状态或者决策的影响，也就是未来与过去无关；在推导后面阶段的状态时，只需要关心前面阶段的具体状态值，不用关心这个状态是怎么一步步推导出来的。

无后效性

比如在一个 5x5 的格子中，从起点（0,0）走到终点（4,4) 总共有多少种走法？前提是只能向右、向下走。

假设 dp(i, j) 是从 (0,0) 走到 (i, j) 的走法，那么当 dp(i,0) = dp(0,j) = 1，dp(i, j) = dp(i, j-1) + dp(i-1, j)。

当推导 dp(i, j) 时，只需要用到 dp(i, j-1) 和 dp(i-1, j) 的值，不需要关心 dp(i, j-1) 和 dp(i-1, j) 的值是怎么求出来的，这就是无后效性。

如果更改一下前提，就是可以向下、向上、向左、向右走，并且同一个格子不可以走2次。那么求 dp(i, j) 时，需要关心 dp(i, j-1) 和 dp(i-1, j) 是如何获得的，这就是有后效性。

找零钱——案例

假设有25分、20分、5分、1分的硬币，现在要找给客户41分零钱，如何办到找的硬币个数最少？

这个案例在贪心策略（[[220527 数据结构与算法-进阶（十八）贪心]]）中被求解过，但是贪心策略求得的结果不是最优解。

运用动态规划求解这个问题时，假设 dp(n) 是找 n 分需要的最少硬币个数，有以下几种可能：

如果第一次选择了25分硬币，那么 dp(n) = dp(n-25) + 1;
如果第一次选择了20分硬币，那么 dp(n) = dp(n-20) + 1;
如果第一次选择了5分硬币，那么 dp(n) = dp(n-5) + 1;
如果第一次选择了1分硬币，那么 dp(n) = dp(n-1) + 1;

综上所有可能，dp(n) = min { dp(n-25), dp(n-20), dp(n-5), dp(n-1)} + 1。

首先使用暴力递归的思想实现代码：

static int coins1(int n) {
    if (n < 1) return Integer.MAX_VALUE;
    if (n == 1 || n == 5 || n == 20 || n == 25) return 1;
    int min1 = Math.min(coins1(n - 1), coins1(n-5));
    int min2 = Math.min(coins1(n-20), coins1(n-25));

    return Math.min(min1, min2) + 1;
}

因为使用了递归的思想，所以会有大量的重复计算，时间复杂度也是比较高的。那么就可以使用数组记录计算出的值，避免重复的计算，即记忆搜索的思想，实现代码如下：

static int coins2(int n) {
    if (n < 1) return -1;
    int[] dp = new int[n+1];
    int[] faces = {1, 5, 20, 25};
    for (int face : faces) {
        if (n < face) break;
        dp[face] = 1;
    }

    return coins2(n, dp);
}

static int coins2(int n, int[] dp) {
    if (n < 1) return Integer.MAX_VALUE;
    if (dp[n] == 0) {

        int min1 = Math.min(coins1(n - 1), coins1(n-5));
        int min2 = Math.min(coins1(n-20), coins1(n-25));
        dp[n] = Math.min(min1, min2) + 1;
    }
    return dp[n];
}

代码中可以看到，创建了一个长度为 n+1 的数组 dp 存放找零硬币的个数，为什么要创建 n+1 的长度呢？

因为找的 n-1 有可能是任意小于 n 的值，并且索引和要找的 n 保持一致，不用时刻操心 index = n -1 的事情，所以创建的数组长度为 n+1。

梳理上面的代码，可以看到递归的规律，就是先拆解原问题为子问题，然后从子问题的解推导出原问题的解，即自顶向下。那么可不可以直接从子问题的解去推导呢？

答案是肯定的，也就是自底向上，在代码部分，要多做一些边界判断处理，代码如下：

static int coins3(int n) {
    if (n < 1) return -1;
    int[] dp = new int[n+1];
    for (int i = 1; i <= n; i++) {
        int min = dp[i-1];
        if (i >=5) min = Integer.min(dp[i-5], min);
        if (i >=20) min = Integer.min(dp[i-20], min);
        if (i >=25) min = Integer.min(dp[i-25], min);
        dp[i] = min + 1;
    }
    return dp[n];
}