动态规划

动态规划过程:每次决策依赖于当前状态,又随即引起状态的转移。
一个决策序列就是在变化的状态中产生出来的,所以,这样的多阶段最优化决策解决这个问题的过程就称为动态规划。
动态规划是运筹学中用于求解决策过程中的最优化数学方法。

假设问题是由交叠的子问题所构成,我们就能够用动态规划技术来解决。一般来说,这种子问题对给定问题求解的递推关系,这个递推关系包括了同样问题的更小子问题的解。动态规划法建议,与其对交叠子问题一次重新的求解,不如把每个较小子问题仅仅求解一次,并把结果记录在表中(动态规划也是空间换时间)。这样就能够从表中得到原始问题的解。
动态规划经常使用于解决最优化问题,这些问题多表现为多阶段决策。
关于多阶段决策:
在实际中,人们经常遇到这样一类决策问题:即因为过程的特殊性,能够将决策的全过程根据时间或空间划分若干个联系的阶段。
而在各阶段中,都要作出决策,当一个阶段作出决策后,经常影响到下一个阶段的决策,从而影响整个过程的活动。这样,各个阶段所确定的决策就构成一个决策序列,常称之为策略。因为各个阶段可供选择的决策往往不止一个。因而就可能有很多决策以供选择,这些可供选择的策略构成一个集合,我们称之为同意策略集合(简称策略集合)。每一个策略都对应地确定一种活动的效果。我们假定这个效果能够用数量来衡量。
因为不同的策略经常导致不同的效果,因此,怎样在同意策略集合中选择一个策略,使其在预定的标准下达到最好的效果。

案例一(一维):
有n级台阶,一个人每次上一级或者两级,稳有多少种走完n级台阶的方法。
分析:动态规划的实现的关键在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值