【1】概念原理多阶段决策特点
▶多阶段决策是与时间相关的;
▶多阶段决策依赖于当前的状态;
▶每一个时段都要作出决策;
▶全部过程的决策是一个决策序列;
▶本段决策的执行将影响下一阶段的决策;
▶不仅要考虑本阶段最优,更要考虑全局最优;最优性原理
▶无论过去的状态和决策如何,对前面决策所形成的状态而言,余下的诸决策必须构成最优策略;
▶将决策问题划分为若干个阶段,全过程的优化问题就分解为子过程的优化问题,由后向前逐步倒推,最优化的子过程逐渐成为全过程最优;
▶作为全过程的最优策略P*1,n的组成部分的任一子策略P*k,n(Sk),一定是从状态Sk出发直至终点的最优策略。相关概念
▶阶段
将所给问题的过程,按时间或空间特征分解成若干相互联系的阶段,以便按次序去求每个阶段的解。常用字母k表示。
▶状态
各阶段开始时的客观条件。状态用变量Sk表示。
▶决策
确定下一阶段的状态,表示决策的变量称为决策变量,Uk(Sk)表示第k阶段的状态为Sk时的决策变量,它是状态变量的函数。
▶策略
各段决策确定后,整个问题的决策序列就构成一个决策序列。
▶状态转移方程
确定过程由一个状态到另一个状态的演变过程。若给定第k阶段状态变量Sk的值,如果该段的决策变量Uk一经确定,第k+1阶段的状态变量Sk+1的值也就完全确定。
▶指标函数(最优指标函数)