含义:多阶段决策过程的最优化问题;
模型:f(Uk) = opt{f[Uk-1] + L[Uk-1,Xk-1]}, 即状态Uk-1通过策略Xk-1,耗费L[Uk-1,Xk-1],转化为状态Uk
适用问题特点:(1) 最优子结构性质 : 不论处于任何阶段,对当前状态而言,余下的诸决策必须构成最优策略;
(2) 无后效性:当前状态是之前历史的一个完整总结,之前的各阶段状态无法影响未来决策;
(3) 子问题的重叠性:将指数级复杂度减小为多项式级复杂度,关键在于解决冗余。
动态规划的思想实质是以空间换时间,因为需要存储每个阶段的状态数据,这样可以让所有包含同一个子问题的所有子问题共用一个问题解。
暂时写一点,以后再举例子。