最优性原理

看了很多有关最优性原理的解释,总是感觉不清晰、不透彻,以下是我个人的理解

我们先给出定义:

最优性原理 对于多阶段决策过程的最优决策序列具有如下性质:不论初始状态和初始决策如何,对于前面决策所造成的某一状态而言,其后各阶段的决策序列必须构成最优策略

它看上去很讨厌,如同与你玩文字游戏,我们单看冒号前的文字,可知:
1)首先它指出,这是一个性质,是最优决策序列的性质
2)假设我们已知这个最优决策序列

好了我们就此打住,不继续往下解读了,我们来看一个直观的例子:
最优性原理
假设有地点A、B、C、D、E,火车要从A开往E,求最短路线

这显然是一个多阶段决策问题,火车每到达一个地点,必须选择下一个开往的地点

假设我们已知这个问题的最优决策序列,显然它是A->B->C->E
请一定记住,我们接下来的讨论都是基于这个假设之上的

火车到达B后,从B开往E的最短路线是什么?

我们不知道,我们现在只知道:
1)从A开往E的最短路线A->B->C->E
2)B处有两个决策:开往C或开往D

此时,冒号之后的文字起了作用,在这个问题里,它表达为:从B开往E的最短路线必须在A->B->C->E上,即B->C->E,故火车在B处选择开往C

换一个角度理解,那么最优性原理想要表达的就是:
对于多阶段决策问题,整个问题的最优决策序列,一定包含了它子问题的最优决策序列
不严谨地说就是,多阶段决策问题的整体最优解一定能使得局部最优

  • 12
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值