ACM 学习总结

动态规划预习
什么是动态规划
一 动态规划是解决多段决策问题的方法。
概念
决策:生活中我们经常能够碰到这样一类问题,它的过程可以按照时间顺序分成若干个相互联系的子阶段。每一个子阶段都可以得出一个结论,学术上我们称之为决策,则这一整个过程的决策就是这些子阶段的决策的总和,即决策序列。这种过程称为多阶段决策过程。
阶段:据空间顺序或时间顺序对问题的求解划分阶段。
状态:描述事物的性质,不同事物有不同性质,因而用不同状态来刻画。对问题的求解状态的描述是分阶段的。
状态转移方程:用数学公式描述与阶段相关的状态间的演变规律。
多段决策问题
如果一类问题的求解过程可以分为若干个互相联系的阶段,在每个阶段都需要做出决策并影响到下一阶段的决策。而我们则需要在每次决策中选择最优策略,使在预定标准下达到最好的效果。
性质
子问题重叠性质
子问题的重叠性描述的是在用递归算法自顶向下对问题进行求解时,每次产生的子问题并不总是新问题,有些子问题会被重复计算多次。既子问题之间有关联。
最优性原理
不论初始状态和第一步决策是什么,余下的决策相对于前一次决策所产生的新状态,构成一个最优决策序列。
最优决策的子序列一定是局部最优决策子序列。
包含非局部最优的决策子序列,一定不是最优决策序列。
动态规划的指导思想
在做每一次决策时列出各种可能的局部解。
依据某种判定条件,舍弃那些肯定不能得到最优解的局部解。
以每一步都是最优的来保证全局是最优的。

动态规划问题的一般解题步骤
1.判断问题是否具有最优子结构性质,否则不能使用动态规划。
2.把问题分成若干个子问题。
3.建立状态转移方程(递推公式)
4.找出边界条件。
5.将以知边界值代入方程
6递归求解。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值