看了很多有关最优性原理的解释,总是感觉不清晰、不透彻,以下是我个人的理解
我们先给出定义:
最优性原理 对于多阶段决策过程的最优决策序列具有如下性质:不论初始状态和初始决策如何,对于前面决策所造成的某一状态而言,其后各阶段的决策序列必须构成最优策略
它看上去很讨厌,如同与你玩文字游戏,我们单看冒号前的文字,可知:
1)首先它指出,这是一个性质,是最优决策序列的性质
2)假设我们已知这个最优决策序列
好了我们就此打住,不继续往下解读了,我们来看一个直观的例子:
假设有地点A、B、C、D、E,火车要从A开往E,求最短路线
这显然是一个多阶段决策问题,火车每到达一个地点,必须选择下一个开往的地点
假设我们已知这个问题的最优决策序列,显然它是A->B->C->E
请一定记住,我们接下来的讨论都是基于这个假设之上的
火车到达B后,从B开往E的最短路线是什么?
我们不知道,我们现在只知道:
1)从A开往E的最短路线A->B->C->E
2)B处有两个决策:开往C或开往D
此时,冒号之后的文字起了作用,在这个问题里,它表达为:从B开往E的最短路线必须在A->B->C->E上,即B->C->E,故火车在B处选择开往C
换一个角度理解,那么最优性原理想要表达的就是:
对于多阶段决策问题,整个问题的最优决策序列,一定包含了它子问题的最优决策序列
不严谨地说就是,多阶段决策问题的整体最优解一定能使得局部最优