数学建模(4):动态规划

动态规划是一种解决问题的方法,常用于经济管理、生产调度等领域。本文介绍了动态规划模型的五个要素:阶段、状态、决策、策略和指标函数,并通过最短路线、生产计划和资源分配三个问题举例说明了动态规划的解题步骤。动态规划与静态规划的关系也被探讨,动态规划可以看作是求极值问题,某些静态规划问题可以通过引入阶段变量转化为动态规划问题。
摘要由CSDN通过智能技术生成

动态规划本身并不是类似前三篇文章所说明的一样,是一种规定的算法,而更像是考察问题的一种途径。自问世以来,它在经济管理、生产调度、工程技术和优控制等方面得到了广泛的应用。例如短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。

§1 动态规划模型的要素

动态规划模型的要素是对问题解决的抽象,其可分为:

  1. 阶段。指对问题进行解决的自然划分。例如:在最短线路问题中,每进行走一步的决策就是一个阶段。
  2. 状态。指一个阶段开始时的自然状况。例如:在最短线路问题中,每进行走一步后,对所走的点进行标注。
  3. 决策。当一个阶段的状态确定后,作出选择从而演变到下一阶段的某个状态的选择手段称为决策,在优控制问题中也称为控制。
  4. 策略。由决策组成的序列称为策略。由第k到第j阶段的策略可记作
    在这里插入图片描述
  5. 状态转移。
    在这里插入图片描述
  6. 指标函数。用以衡量过程的优劣。
    在这里插入图片描述
  7. 最优策略。对于使指标函数Vk,n达到最优值的策略,我们称之为子过程的最优策略。同样的,我们还有全程的最优策略。
  8. 递归方程。每一次最优化的
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值