一、什么是多阶段决策
多阶段决策过程:在解决问题的过程中要做多个决策(每一个阶段都需要做决策),同时这些决策之间还有联系。
二、贪心和动态规划的区别
贪心算法依赖于贪心策略,不同的贪心策略会得出不同的解,同时贪心策略得出的解也未必是全局最优解。
能用动态规划求解的问题求出的解必然是全局最优解。动态规划的决策不是线性的,会全面考虑多种情况。
三、最优性原理及证明
最优性原理:最优性原理是指“多阶段决策过程的最优决策序列具有这样的性质:不论初始状态和初始决策如何,对于前面决策所造成的某一状态而言,其后各阶段的决策序列必须构成最优策略”。(满足最优性原理的问题就可以用动态规划求解)
证明满足最优性原理:
1.设最优决策序列的形式
2.确定初始状态和初始决策
3.初始决策所产生的状态
4.最优决策序列中状态3后面的其余决策相对于状态3是最优决策序列。