动态规划(孙小玲老师课件)
概念:
动态规划是一种求解多阶段决策问题的方法。这种多阶段问题可以分为n个stages,每个stage又有各种状态。动态规划的目的是以Forward或者Backward的方式在每一个阶段进行决策,即选择某个状态,以使最后一个决策做出后整个多阶段问题处于一种最优的决策状态。
依托理论:
最优性原理(the principle of optimality)
1、给定最优的一连串决策或者选择,每一个字串也必定是最优的。
2、最优性原理只能应用于多阶段决策问题,但是并不是所有的多阶段决策问题。
3、States是每个阶段可能的决策,Stages是需要做出决策的阶段。