动态规划之最优化原理与动态规划方程

最新推荐文章于 2024-04-13 14:44:18 发布

Rain松

最新推荐文章于 2024-04-13 14:44:18 发布

阅读量5.6k

点赞数 2

分类专栏：数据结构与算法动态规划文章标签：算法动态规划

本文链接：https://blog.csdn.net/HanTangSongMing/article/details/111664574

版权

数据结构与算法同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

动态规划

3 篇文章 0 订阅

订阅专栏

动态规划

引言

1951年，美国数学家贝尔曼（R.Bellman）等根据一类所谓多阶段决策问题的特性，提出了解决这类问题的“最优化原理”，并研究了许多实际问题，从而创立了最优化的一个新分支----动态规划。
动态规划没有统一的数学模型，对不同的问题要采用不同的方法去建立它们的模型。有了模型之后，要想得到数值解，仍然没有统一的处理方法。这是应当注意的。

1 动态规划原理

1.1 最短路问题及其解法

最短路问题及其解法

1.2 动态规划的基本概念和术语

动态规划的基本概念和术语

1.3 最优化原理与动态规划方程

1.3.1 最优化原理

对于多阶段决策问题，作为整个过程的最优策略必然具有这样的性质：无论过去的状态和决策如何，就所形成的状态而言，余下的诸策略必然构成一个最优子策略。多阶段决策问题的这一规律称为最优化原理。

1.3.2 逆序动态规划方程

对后部指标函数 $F_{k,n}$ 及最优函数 $f_k(x_k)$ 有

（1）当 $F_{k,n}=\sum\limits_{j=k}^nd(x_j,u_j)$ 时， $f_k(x_k)满足递推方程$
$\left\{ \begin{array}{lcl} f_k(x_k) = \mathop{opt} \limits_{u_k \in D_k} \{ d(x_k,u_k) + f_{k+1}(x_{k+1})\} ，\\ f_{n+1}(x_{n+1})=0, k=n,n-1,\cdots,2,1 \end{array} \right.$

（2）当 $F_{k,n}=\prod\limits_{j=k}^nd(x_j,u_j)$ 时， $f_k(x_k)满足递推方程$
$\left\{ \begin{array}{lcl} f_k(x_k) = \mathop{opt} \limits_{u_k \in D_k} \{ d(x_k,u_k) \cdot f_{k+1}(x_{k+1})\} ，\\ f_{n+1}(x_{n+1})=1, k=n,n-1,\cdots,2,1 \end{array} \right.$

利用这两个递推公式原则上可求出最优函数 $f_1(x_1)$ ，称这两种递推公式为逆序动态规划方程。这种求最优函数的方法叫逆序法。

1.3.3 顺序动态规划方程

对前部指标函数 $F_{1,k}$ 及最优函数 $f_k(x_k)$ 有

（1）当 $F_{1,k}=\sum\limits_{j=2}^kd(u_{j-1},x_j)$ 时， $f_k(x_k)$ 满足递推方程
$\left\{ \begin{array}{lcl} f_k(x_k) = \mathop{opt} \limits_{u_{k-1} \in D_{k-1}} \{ d(u_{k-1},x_k) + f_{k-1}(x_{k-1})\} ，\\ f_1(x_1)=0, k=2,3,\cdots,n,n+1 \end{array} \right.$

（2）当 $F_{1,k}=\prod\limits_{j=k}^nd(u_{j-1},x_j)$ 时， $f_k(x_k)$ 满足递推方程
$\left\{ \begin{array}{lcl} f_k(x_k) = \mathop{opt} \limits_{u_{k-1} \in D_{k-1}} \{ d(u_{k-1},x_k) \cdot f_{k-1}(x_{k-1})\} ，\\ f_1(x_1)=1, k=2,3,\cdots,n,n+1 \end{array} \right.$

利用这两个递推公式原则上可求出最优函数 $f_{n+1}(x_{n+1})$ ，称这两种递推公式为顺序动态规划方程。这种求最优函数的方法叫顺序法。

1.4 动态规划基本定理

基本定理 对于 $n$ 阶段决策问题，若 $p^{\ast}_{1,n}$ 是最优策略，则对任意满足 $1 < k < n$ 的自然数 $k$ ，其子策略 $p^{\ast}_{k,n}$ （或 $p^{\ast}_{1,k}$ ）对于以
$x_k = T_{k-1}(x_{k-1},u^{\ast}_{k-1}) （或x_{k-1} = T_{k-1}(u^{\ast}_{k-1}, x_{k})）$
为初始状态的 $k$ 到 $n$ （或 $1$ 到 $k$ ）段子过程来说，也必定是最优策略。

Rain松

关注

2
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
动态规划之最优化原理与动态规划方程

目录动态规划引言1 动态规划原理1.1 最短路问题及其解法1.2 动态规划的基本概念和术语1.3 最优化原理与动态规划方程1.3.1 最优化原理1.3.2 逆序动态规划方程1.3.3 顺序动态规划方程1.4 动态规划基本定理动态规划引言 1951年，美国数学家贝尔曼（R.Bellman）等根据一类所谓多阶段决策问题的特性，提出了解决这类问题的“最优化原理”，并研究了许多实际问题，从而创立了最优化的一个新分支----动态规划。动态规划没有统一的数学模型，对不同的问题要采用不同的方法去建立它们的模
复制链接

扫一扫

专栏目录