动态规划（一）

最新推荐文章于 2024-07-13 16:30:23 发布

sylar_d

最新推荐文章于 2024-07-13 16:30:23 发布

阅读量5.5k

点赞数 4

分类专栏：算法文章标签：动态规划优化结构网络

本文链接：https://blog.csdn.net/sylar_d/article/details/50865958

版权

本文介绍了动态规划的概念，主要用于解决最优化问题。动态规划旨在优化随机问题的统计平均最优解，文章通过离散时间系统和代价函数阐述了其结构，并通过随机优化问题、确定优化问题及无线网络问题的实例深入解析动态规划的应用。动态规划的特点包括局部控制、马尔科夫性和策略映射等。

摘要由CSDN通过智能技术生成

最优化问题

最优化问题

动态规划(Dynamic programming)是用来优化一个随机问题的最优解，随机问题是只我们优化的目标是随机的，最优解指的是在统计平均上的最优。

比较权威的参考资料：Dimiri P. Bertsekas, Dynamic Programming and Optimal Control, 3rd ed., Athena Scientific, Belmont, Massachusetts,2005

一般优化问题描述

m i n u \in U g (u)

$\mathop {min}\limits_{u\in \mathcal{U}} g(u)$

$~u~$ 是最优化问题的决策
$~g(u)~$ 是决策的代价函数
$~\mathcal{U}~$ 是所有决策 $~u_i~$ 的集合

动态规划的优化问题可以分为：
1. 随机优化问题：
由于代价函数存在一个随机变量 $w$ ，因此最优解的优化目标是代价函数的统计平均。

g(u)=EwG(u,w)
1. 确定优化问题：
这个问题代价函数是一个确定函数。

如何区分这两个问题呢？我们可以观察系统是否存在随机性，这个随机性是体现在系统之中的，而不是这个系统。举个栗子，优化一个随机网络是个确定性问题，即给定任意网络结构，找到最短路径，因为网络虽然是随机的，但是优化的目标在确定以后是不变的。然而优化一个随时变化的网络是一个随机问题，即一边进行优化，网络结构一边在变的问题。
动态规划正是可以解决每一个步骤都有随机变量 $~w~$ 影响的目标函数，如何在全局取得统计平均上最优解的问题。后面我们可以看到每一个决策都会利用 $~w~$ 的信息。

随机动态规划的结构

离散时间系统

x k + 1 = f k (x k, u k, w k), k = 0, 1, \dots, N - 1

$x_{k+1} =f_k(x_k,u_k,w_k), k=0,1,\ldots,N-1$

其中：

$~k~$ ：表示离散 $\color{red}{时间}$ （也可以看作是步骤）。
$~x_k~$ ：表示在时间 $~k~$ 的 $\color{red}{状态}$ ，该状态具有马尔科夫性，即当前状态已经包含决策所需要的各种信息，与之前的状态无关。当前状态将会参与决策。
$~u_k~$ ：表示在时间 $~k~$ 所输出的 $\color{red}{控制}$ ，即再时间 $~k~$ 在集合 U

最低0.47元/天解锁文章

sylar_d

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
动态规划（一）

最优化问题一般优化问题描述随机动态规划的结构离散时间系统离散时间系统代价函数第一个栗子随机动态优化问题第二个栗子确定动态优化问题第三个栗子来点复杂的无线网络问题小结最优化问题动态规划(Dynamic programming)是用来优化一个随机问题的最优解，随机问题是只我们优化的目标是随机的，最优解指的是在统计平均上的最优。比较权威的参考资料：Dimiri
复制链接

扫一扫

专栏目录