动态规划本身并不是类似前三篇文章所说明的一样,是一种规定的算法,而更像是考察问题的一种途径。自问世以来,它在经济管理、生产调度、工程技术和优控制等方面得到了广泛的应用。例如短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。
§1 动态规划模型的要素
动态规划模型的要素是对问题解决的抽象,其可分为:
- 阶段。指对问题进行解决的自然划分。例如:在最短线路问题中,每进行走一步的决策就是一个阶段。
- 状态。指一个阶段开始时的自然状况。例如:在最短线路问题中,每进行走一步后,对所走的点进行标注。
- 决策。当一个阶段的状态确定后,作出选择从而演变到下一阶段的某个状态的选择手段称为决策,在优控制问题中也称为控制。
- 策略。由决策组成的序列称为策略。由第k到第j阶段的策略可记作
- 状态转移。
- 指标函数。用以衡量过程的优劣。
- 最优策略。对于使指标函数Vk,n达到最优值的策略,我们称之为子过程的最优策略。同样的,我们还有全程的最优策略。
- 递归方程。每一次最优化的