动态规划学习笔记——第15周

最新推荐文章于 2024-07-19 13:59:11 发布

kkkkkkc1

最新推荐文章于 2024-07-19 13:59:11 发布

阅读量153

点赞数

分类专栏： C 文章标签：动态规划算法

本文链接：https://blog.csdn.net/kkkkkkc1/article/details/111407675

版权

C 专栏收录该内容

9 篇文章 1 订阅

订阅专栏

一、基础概念

动态规划（Dynamic Programming，DP）是运筹学的一个分支，是求解决策过程最优化的过程。20世纪50年代初，美国数学家贝尔曼等人在研究多阶段决策过程的优化问题时，提出了著名的最优化原理，从而创立了动态规划。动态规划的应用极其广泛，包括工程技术、经济、工业生产、军事以及自动化控制等领域，并在背包问题、生产经营问题、资金管理问题、资源分配问题、最短路径问题和复杂系统可靠性问题等中取得了显著的效果。

动态规划算法通常基于一个递推公式及一个或多个初始状态。当前子问题的解将由上一次子问题的解推出。

动态规划算法的核心是记住已经求过的解，求解的方式有两种：①自顶向下的备忘录法 ②自底向上。

使用动态规划的问题一般满足下面的三大性质：

1、最优子结构性质：如果问题的最优解所包含的子问题的解也是最优的，我们就称该问题具有最优子结构性质（即满足最优化原理）。最优子结构性质为动态规划算法解决问题提供了重要线索。

2、子问题重叠性质：子问题重叠性质是指在用递归算法自顶向下对问题进行求解时，每次产生的子问题并不总是新问题，有些子问题会被重复计算多次。动态规划算法正是利用了这种子问题的重叠性质，对每一个子问题只计算一次，然后将其计算结果保存在一个表格中，当再次需要计算已经计算过的子问题时，只是在表格中简单地查看一下结果，从而获得较高的效率。

3、无后效性：将各阶段按照一定的次序排列好之后，对于某个给定的阶段状态，它以前各阶段的状态无法直接影响它未来的决策，而只能通过当前的这个状态。换句话说，每个状态都是过去历史的一个完整总结。这就是无后向性，又称为无后效性。

总得来说，动态规划分为三个步骤：
1、阶段划分

2、找出状态转移方程

3、求解最优解

二、例题分析

1）简单的一维DP

问题描述：一只青蛙一次可以跳上1级台阶，也可以跳上2级。求该青蛙跳上一个n级的台阶总共有多少种跳法。

定义数组元素的含义：

定义 dp[i] 的含义为：跳上一个 i 级的台阶总共有 dp[i] 种跳法
找出数组元素间的关系式：

dp[n] = dp[n-1] + dp[n-2]
找出初始条件：

当 n = 1 时，dp[1] = dp[0] + dp[-1]，而我们是数组是不允许下标为负数的，所以对于 dp[1]，我们必须要直接给出它的数值，相当于初始值，显然，dp[1] = 1。一样，dp[0] = 0.（0 个台阶0 种跳法）。于是得出初始值：dp[0] = 0。但光考虑到这里，还不够严谨，当 n = 2 时，dp[2] = dp[1] + dp[0] = 1。这显然是错误的，应该加上 dp[2] = 2。

代码实现：

int f( int n ){
    if(n <= 1)
    return n;
    // 先创建一个数组来保存历史数据
    int[] dp = new int[n+1];
    // 给出初始值
    dp[0] = 0;
    dp[1] = 1;
    // 通过关系式来计算出 dp[n]
    for(int i = 2; i <= n; i++){
        dp[i] = dp[i-1] + dp[i-2];
    }
    // 把最终结果返回
    return dp[n];
}

2）二维数组的DP

问题描述:一个机器人位于一个 m x n 网格的左上角（起始点在下图中标记为“Start” ）。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角（在下图中标记为“Finish”）。问总共有多少条不同的路径。

在这里插入图片描述

1.定义数组元素的含义：

定义 dp[i] [j]的含义为：当机器人从左上角走到(i, j) 这个位置时，一共有 dp[i] [j] 种路径。

2.找出数组元素间的关系式：

dp[i] [j] = dp[i-1] [j] + dp[i] [j-1]

3.找出初始条件：

  dp[0] [0….n-1] = 1; // 相当于最上面一行，机器人只能一直往左走

  dp[0…m-1] [0] = 1; // 相当于最左面一列，机器人只能一直往下走

代码实现：

public static int uniquePaths(int m, int n) {
    if (m <= 0 || n <= 0) {
        return 0;
    }
 
    int[][] dp = new int[m][n]; // 
      // 初始化
      for(int i = 0; i < m; i++){
      dp[i][0] = 1;
    }
      for(int i = 0; i < n; i++){
      dp[0][i] = 1;
    }
        // 推导出 dp[m-1][n-1]
    for (int i = 1; i < m; i++) {
        for (int j = 1; j < n; j++) {
            dp[i][j] = dp[i-1][j] + dp[i][j-1];
        }
    }
    return dp[m-1][n-1];
}

kkkkkkc1

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
动态规划学习笔记——第15周

一、基础概念动态规划（Dynamic Programming，DP）是运筹学的一个分支，是求解决策过程最优化的过程。20世纪50年代初，美国数学家贝尔曼等人在研究多阶段决策过程的优化问题时，提出了著名的最优化原理，从而创立了动态规划。动态规划的应用极其广泛，包括工程技术、经济、工业生产、军事以及自动化控制等领域，并在背包问题、生产经营问题、资金管理问题、资源分配问题、最短路径问题和复杂系统可靠性问题等中取得了显著的效果。动态规划算法通常基于一个递推公式及一个或多个初始状态。当前子问题的解将由上一次
复制链接

扫一扫