动态规划问题详解(三)

最新推荐文章于 2023-06-28 23:44:16 发布

jimmy_游戏人生

最新推荐文章于 2023-06-28 23:44:16 发布

阅读量975

点赞数

分类专栏：算法文章标签：动态规划

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/majinfei/article/details/17099329

版权

算法专栏收录该内容

8 篇文章 0 订阅

订阅专栏

在动态规划问题详解1,2中，我们只是拿了2个例子说明了一下什么是动态规划，及解题的思路。并没有形成一套完整的理论。这篇文章，我们将讨论如何用数学模型给动态规划问题建模。

图一

如图一所示，找出从A--->E 点的最短路径。

阶段变量

我们把整个过程分成4个阶段，A->B1(B2) , B1(B2)-->C1(C2,C3) , C1(C2,C3)->D1(D2), D1(D2)->E.整个问题，可以看成是4个阶段的决策问题，描述阶段次序的变量，称为阶段变量。用k来表示。

状态

一个阶段在开始时所面临的状况，称为状态，一个状态，既是起点，又是终点。每个阶段的所有的状态，构成了状态集合。如第一阶段的状态的集合为{A}，第三阶段的状态的集合为{C1,C2,C3,C4}.描述过程状态的变量，称为状态变量。一般用x_k来表示第k个阶段的某个状态.

决策

一个阶段的状态给定以后，从一个状态到另一个状态的选择，我们称之为决策。用来描述这种选择的变量称为决策变量，一般用u_k(x_k)表示第k个阶段，状态为x_k的决策变量。决策变量，允许选择的变量，称为允许决策变量用U_k表示。如果用X_3表示第三个阶段的状态的集合，则X_3={C1,C2,C3} .如果从C2出发，则U_2(c2)={D1,D2}如果我们选择了D2，那么u_3(c2)=D2

策略

由各个阶段的决策，u_k(x_k) k={1,2,3,....n}组成的决策序列，称为一个策略，一般用P表示一个策略。P_n={u_1(x_1),u_2(x_2)....u_n(x_n)}

在实际的问题中，可供选择的策略是有限的，如{A,B2,C3,D2,E}. 是一种策略。图1中所示的，允许策略集合一共包含2*2*2*1=8个策略。允许策略集合中达到最优效果和策略称为最优策略。

状态转移方程

所谓状态转移就是过程由于一个状态转变到另一个状态的变化。显然，它既与前一状态有关，又与所选择的决策有关。显然，第k段的状态x_k和决策u_k(x_k)一经确定后，第k+1段的状态x_k+1,也就随之确定。那么这个对应关系可记作：

x_k+1=T_k(x_k,u_k(x_k))称为由状态x_k到x_k+1状态转移方程。在图1中，当x2=B1,时，u_2(x2)=C2,则有下一个状态 c2= T(B1,C2)

指标函数

为了衡量策略的优劣，我们引入了指标函数，用V_kn表示。最优指标函数胜f_k_n表示。图1 中，f_k_n表示从点xk到终点的最短路径。

基本思想

我们仍然以图1为例。我们假设在A-E的最短路径中，存在一点p,则P->E是最短的路径。有了以上的思想之后，我们就可以采用逆序求解的思想进行了。

逆序求解

如图1中，我们可以先求解第四阶段的最优解。然后再求第三阶段，第二阶段，第一阶段。

当k=4时，f_4(D1)=4

当k=3时，出发点有c1,c2,c3 .

f_3(c1)=d(C1,D1)+ f_4(D1))= 7 当C1选择D1时

f_3(c1)=d(C1,D2)+f_4(D2)=8 当C1选择D2时。

最f_3(c1)的最小值7，则第三阶段的最优解为f_3(c1)=7，其策略为u_3(c1)=D1

直到求出f1.

因为是倒序，所以k的状态由k+1的状态及策略决定。

jimmy_游戏人生

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
动态规划问题详解(三)

在动态规划问题详解1,2中，我们只是拿了2个例子说明了一下什么是动态规划，及解题的思路。并没有形成一套完整的理论。这篇文章，我们将讨论如何用数学模型给动态规划问题建模。
复制链接

扫一扫

专栏目录

jimmy_游戏人生

博客等级

码龄16年

161
原创

41
点赞

61
收藏

20
粉丝

关注

私信

热门文章

分类专栏

linux 70篇
python 11篇
正则表达式 2篇
算法 8篇
java 35篇
js 3篇
开发工具 12篇
sql 12篇
c/c++ 9篇

最新评论

sudo 提示命令找不到
Balance Life: https://www.linuxdiyf.com/view_196216.html
使用python做webservice服务
无所期必满载而归: 大佬,问您一下,参数类中__namespace__是什么?具体用来干什么?是否可有可无?
rinetd 一个linux下的端口转发工具
无若: 可以试一下 rein，用 go 开发，直接下载编译好的可执行文件（支持windows，linux，mac）。https://github.com/firstboot/rein
ln -sf 的用法
他大舅m: 强行创建软链接，-s为创建软链接参数，-f强制创建。
maven 指定pom.xml 启动
思灵月: 不错！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。