动态规划过程:每次决策依赖于当前状态,又随即引起状态的转移。
一个决策序列就是在变化的状态中产生出来的,所以,这样的多阶段最优化决策解决这个问题的过程就称为动态规划。
动态规划是运筹学中用于求解决策过程中的最优化数学方法。
假设问题是由交叠的子问题所构成,我们就能够用动态规划技术来解决。一般来说,这种子问题对给定问题求解的递推关系,这个递推关系包括了同样问题的更小子问题的解。动态规划法建议,与其对交叠子问题一次重新的求解,不如把每个较小子问题仅仅求解一次,并把结果记录在表中(动态规划也是空间换时间)。这样就能够从表中得到原始问题的解。
动态规划经常使用于解决最优化问题,这些问题多表现为多阶段决策。
关于多阶段决策:
在实际中,人们经常遇到这样一类决策问题:即因为过程的特殊性,能够将决策的全过程根据时间或空间划分若干个联系的阶段。
而在各阶段中,都要作出决策,当一个阶段作出决策后,经常影响到下一个阶段的决策,从而影响整个过程的活动。这样,各个阶段所确定的决策就构成一个决策序列,常称之为策略。因为各个阶段可供选择的决策往往不止一个。因而就可能有很多决策以供选择,这些可供选择的策略构成一个集合,我们称之为同意策略集合(简称策略集合)。每一个策略都对应地确定一种活动的效果。我们假定这个效果能够用数量来衡量。
因为不同的策略经常导致不同的效果,因此,怎样在同意策略集合中选择一个策略,使其在预定的标准下达到最好的效果。
案例一(一维):
有n级台阶,一个人每次上一级或者两级,稳有多少种走完n级台阶的方法。
分析:动态规划的实现的关键在