[算法][动态规划]动态转移过程与Python实现小样两例(切绳子与跳台阶)

身披白袍

已于 2023-11-15 16:23:58 修改

阅读量816

点赞数 1

分类专栏：算法|面试 Python|Matlab 文章标签：动态规划

于 2019-03-10 12:21:24 首次发布

本文链接：https://blog.csdn.net/Shenpibaipao/article/details/88373195

版权

本文介绍了动态规划的基本概念和核心，并通过切绳子问题和跳台阶问题两个实例，详细阐述了如何运用动态规划进行问题求解，包括状态转移方程和Python代码实现。

摘要由CSDN通过智能技术生成

文章目录

1 动态规划要义
- 1.1 编程领域的动态规划是什么
- 1.2 编程领域的动态规划的核心
2 样例两道

写在前面

这是我对动态规划一些入门题的笔记，主要便于随时随地的回顾这些基础内容。

基本都是些简单题目，因为复杂的题目代码太长，不便于作为笔记进行重温。

1 动态规划要义

在重温动态规划的时候，看到了一句类似GNU's Not Unix的语句：

Those who cannot remember the past are condemned to repeat it.

这句话告诉了我们迭代和回溯在DP算法框架中的重要性，或者说找到核心状态及其转移方程的内涵。

1.1 编程领域的动态规划是什么

应当区分在控制领域的动态规划问题，因为控制领域的动态规划确实通过梯度等方式实现了搜索和目标值下降过程。

个人认为基于动态规划的编程是一种高效的枚举方法，通过先前的经验，将子问题递推得到原问题的解。其过程更偏向于随机过程，或者某种意义上的马尔科夫链。
甚至，我不觉得这是一种>传统意义上的数学优化<方法，因为并没有什么目标通过迭代得到了优化和降低。或者说，DP是一种逻辑寻优方法，而不是一种通过大量搜索使得系统目标值降低(升高)的优化方法——当然，二者最终的目的都是得到一个最优解。
尽管在《Dynamic Programming》提到了optimization一词，但是这个词的意义更偏向于"最优解"，是基于DP算法框架通过高效的状态转移和枚举得到最优解；从下面这段引用也可以看出它与“目标优化”这个动态过程没有什么太大关系，更多的是在告诉我们DP算法的回溯结构：

In terms of mathematical optimization, dynamic programming usually refers to simplifying a decision by breaking it down into a sequence of decision steps over time. This is done by defining a sequence of value functions $V_1, V_2, ..., V_n$ taking $y$ as an argument representing the state of the system at times $i$ from $1$ to $n$ . The definition of $V_n(y)$ is the value obtained in state $y$ at the last time $n$ . The values $V_i$ at earlier times $i = n - 1, n - 2, ..., 2, 1$ can be found by working backwards, using a recursive relationship called the Bellman equation. For $i = 2, ..., n, V_{i−1}$