动态规划总结

含义:多阶段决策过程的最优化问题;

模型:f(Uk) = opt{f[Uk-1] + L[Uk-1,Xk-1]}, 即状态Uk-1通过策略Xk-1,耗费L[Uk-1,Xk-1],转化为状态Uk

适用问题特点:(1) 最优子结构性质 : 不论处于任何阶段,对当前状态而言,余下的诸决策必须构成最优策略;

                         (2) 无后效性:当前状态是之前历史的一个完整总结,之前的各阶段状态无法影响未来决策;

                         (3) 子问题的重叠性:将指数级复杂度减小为多项式级复杂度,关键在于解决冗余。


动态规划的思想实质是以空间换时间,因为需要存储每个阶段的状态数据,这样可以让所有包含同一个子问题的所有子问题共用一个问题解。

暂时写一点,以后再举例子。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值