动态规划

动态规划总结

  • 如果一个问题的一次选择策略跟上一次选择策略有关,那这个问题可能是动态规划问题,这个策略造成的结果称为状态。
  • 动态规划解决的问题是:一个阶段的最优可以由前一个阶段的最优得到。注意,这里有一个容易混淆的地方,一个阶段的最优可以有前一个阶段的最优得到,而不是由前面所有阶段的最优得到。
  • 一般较常见的动态规划问题需要给出一个策略,其相应的条件都是数值型。问题的目标是要求一个价值最大或最小,这个价值又受到其他约束条件限制。如果不是数值型的条件,应该也可以用变体的动态规划求解。
  • 动态规划的思路其实是逆向看问题,求d(i)的最值时,考虑不同选择下,d(i)与d(i-1)的关系。逆向看问题,实现了局部最优向全局最优的转化,这是动态规划的精髓。
  • 动态规划的思维方式是逆向的,但实际代码的编写一般是正向递推的。那是因为

    • 如果实际编码也是逆向递推的,会造成无法进行策略选择,因为不知道之前的状态孰优孰劣。
    • 如果实际编码是正向递推的,在正向递推过程中,保存d(j)的值(j

区别

每个阶段只有一个状态->递推;
每个阶段的最优状态都是由上一个阶段的最优状态得到的->贪心;
每个阶段的最优状态是由之前所有阶段的状态的组合得到的->搜索;
每个阶段的最优状态可以从之前某个阶段的某个或某些状态直接得到而不管之前这个状态是如何得到的->动态规划

每个阶段的最优状态可以从之前某个阶段的某个或某些状态直接得到
这个性质叫做最优子结构;

而不管之前这个状态是如何得到的
这个性质叫做无后效性。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值