1.基本思想
动态规划算法通常用于求解具有某种最优性质的问题。
(1) 与分治法相同的地方:其基本思想是将待求解问题分解成若干个子问题,先求解子问题,然后从这些子问题的解得到原问题的解。
(2) 与分治法不同的地方:适合于用动态规划求解的问题,经分解得到子问题往往不是互相独立的。
- 分治法:分解得到的子问题数目太多,有些子问题被重复计算了很多次。
- 动态规划法:用一个表来记录所有已解的子问题的答案。不管该子问题以后是否被用到,只要它被计算过,就将其结果填入表中。以后在用时,直接在表中取就可以了。
2.基本概念
(1) 多阶段决策问题
如果一类活动过程可以分为若干个互相联系的阶段,在每一个阶段都需作出决策(采取措施),一个阶段的决策确定以后,常常影响到下一个阶段的决策,从而就完全确定了一个过程的活动路线,则称它为多阶段决策问题。
(2) 术语
状态:状态表示每个阶段开始面临的自然状况或客观条件,它不以人们的主观意志为转移,也称为不可控因素。在上面的例子中状态就是某阶段的出发位置,它既是该阶段某路的起点,同时又是前一阶段某支路的终点 [5]
决策ÿ