动态规划基本概念与求解方法
动态规划是运筹学的一个分支,是解决多阶段决策过程最优化的一种数学方法,主要用于以时间或地域划分阶段的动态过程的最优化。本文以一个典型的例子来说明动态规划的基本概念和逆推法求解,以让各位快速地理解动态规划的要点。
例子
某公司拟用3千万元改造下属3个工厂,每个工厂的利润增长额与所分配投资额的关系如下表所示。问如何分配能使总利润增长额最大?(投资额只能为整千万元)
表1
投资额(千万元) | 0 | 1 | 2 | 3 |
---|---|---|---|---|
1号工厂 | 0 | 2.5 | 4 | 10 |
2号工厂 | 0 | 3 | 5 | 8.5 |
3号工厂 | 0 | 2 | 6 | 9 |
该问题是一个静态问题,可以建立整数规划模型来求解,但是需要采用分支定界法或割平面法,计算过程过于繁琐,此时可以考虑采用动态规划的思路来求解。
基本概念
1.阶段
术语解释:阶段是整个过程的自然划分,通常按时间顺序或空间特征划分阶段。表示阶段序号的变量称为阶段变量,一般用字母k表示。
在这里,我们人为赋予“时段”的概念,将问题看出一个投资规划问题。将投资项目排序,首先考虑对1号工厂的投资,然后考