建立动态规划数学模型的步骤

最新推荐文章于 2024-06-03 11:54:57 发布

Vasari

最新推荐文章于 2024-06-03 11:54:57 发布

阅读量1.9w

点赞数 5

分类专栏：算法

算法专栏收录该内容

10 篇文章 0 订阅

订阅专栏

§ 3 建立动态规划数学模型的步骤

“最优化原理”是动态规划的核心,所有动态规划问题的递推关系都是根据这个原理建立起来的,并且根据递推关系依次计算,最终可求得动态规划问题的解。

一般来说，利用动态规划求解实际问题需先建立问题的动态模型，具体步骤如下：

⒈将问题按时间或空间次序划分成若干阶段。有些问题不具有时空次序，也可以人为地引进时空次序，划分阶段。

⒉正确选择状态变量

。这一步是形成动态模型的关键，状态变量是动态规划模型中最重要的参数。一般来说，状态变量应具有以下三个特性：

    ⑴要能够用来描述决策过程的演变特征。
    ⑵要满足无后效性。即如果某阶段状态已给定后，则以后过程的进展不受以前各状态的影响，也就是说，过去的历史只通过当前的状态去影响未来的发展。
    ⑶递推性。即由k阶段的状态变量

及决策变量uk可以计算出k+1阶段的状态变量

。

⒊确定决策变量

及允许决策变量集合Dk(

)。

⒋根据状态变量之间的递推关系，写出状态转移方程：

=T(

,

(

))

⒌建立指标函数。一般用

(

,

)描写阶段效应，

（

）表示k—n阶段的最优子策略函数。

⒍建立动态规划基本方程：

以上是建立动态规划模型的过程，这个过程是正确求解动态规划的基础。

在动态规划基本方程中，

(

,

)，

=T(

,

)都是已知函数，最优子策略

（

）与

（

）之间是递推关系，要求出

（

）及

(

)，需要先求出

（

），这就决定了应用动态规划基本方程求最优策略总是逆着阶段的顺序进行的。由后向前逐步计算，最终可以算出全过程的最优策略函数值及最优策略。

另一方面，由于k+1阶段的状态

=T(

,

)是由前面的状态

和决策

所形成的，在计算

（

）时还不能具体确定

的值，所以，这就要求必须就k+1阶段的各个可能状态计算

（

），因此动态规划方法不但能求出整个问题的最优策略和最优目标值，而且还能求出决策过程中所有可能状态的最优策略及最优目标值。

下面就按上述步骤求解例2。

例2（带回收的资源分配问题）某厂新购某种机床125台。据估计，这种设备5年后将被其它设备所代替。此机床如在高负荷状态下工作，年损坏率为1/2，年利润为10万元；如在低负荷状态下工作，年损坏率为1/5，年利润为6万元。问应如何安排这些机床的生产负荷，才能使5年内获得的利润最大？

解：以年为阶段，k=1，2，3，4，5，取k年初完好的机床数为状态变量

，以k年初投入高负荷运行的机床数为决策变量

，则低负荷运行机床数是

-

，于是状态转移方程为：

以利润为目标函数，则k年利润为：

记

（

）为k年至5年末最大总利润，则动态规划基本方程为：

以上是建立动态模型的过程，下面具体求解。

注意动态规划基本方程为：

至此已算得最大总利润2790万元，再按与计算过程相反的顺序推回去，可得最优计划如下表所示：

转载自:http://dec3.jlu.edu.cn/webcourse/t000048/yun/ch5_03.htm

关注

5
点赞
踩
53

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Vasari CSDN认证博客专家 CSDN认证企业博客

码龄13年

43: 原创

18万+: 周排名

63万+: 总排名

19万+: 访问

: 等级

2257: 积分

41: 粉丝

38: 获赞

10: 评论

127: 收藏

私信

关注

热门文章

分类专栏

最新评论

动态规划-多阶段决策问题
一蓑烟雨276: 写的很好，赞👍👍👍
解析格式化txt文件为对象
无名_NoOne: 哥哥，这。。。搜到你文章很尴尬啊
谈谈Parser
温铜: 很对，对编译器来讲，parser的重要性不大。完全脱离开parser过程也是可以的，配合GUI编程工具，比如图形编程工具，完全可以直接生成ast。但parser理论的用途比较广，不单单是编译器里用。任何结构化文本的处理，都用的到，比如各种配置文件，数据文件，日志文件等等。如果一种特殊的表结构文本，需要转录到数据库，不写个小parser是不行的。
Go语言，Docker和Kubernetes
拉达曼迪斯II 回复 javaee_chen123: 我肯定是反对的。
Go语言，Docker和Kubernetes
爱青天媛: 按你这么说，什么操作系统、什么编程语言，都是垃圾，你跟王垠有一拼了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。