两阶段与多阶段随机规划

心态与习惯

已于 2023-09-13 18:08:07 修改

阅读量8.1k

点赞数 5

分类专栏：数学优化文章标签：动态规划多阶段规划两阶段规划

于 2022-01-04 23:08:20 首次发布

本文链接：https://blog.csdn.net/robert_chen1988/article/details/122167909

版权

数学优化专栏收录该内容

145 篇文章

订阅专栏

本文介绍了随机规划中的两阶段模型，包括决策变量划分、随机变量的定义及其在模型中的表达形式。随后扩展至多阶段规划，讨论了决策顺序、随机变量转移及各阶段的线性规划模型。重点阐述了情景树模型和非-抗性约束的概念。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这段时间发现一本不错的随机规划教材：《Handbooks in Operations Research and Management Science: Stochastic Programming》。这本书比之前看的一些教材更通俗易懂一些。

总结一下这几天看到的知识点。

1. 两阶段规划

two-stage model 中， $x$ 为第一阶段的决策变量，必须在不确定性发生之前作出决定， $y$ 为第二阶段的决策变量，在不确定性发生之后作出决定。

$\xi$ 为随机变量，而 $\omega$ 为随机变量的一个具体实现值。这里面的决策变量与随机变量都可以是向量。

两阶段随机规划的模型可以表示为：

$\begin{aligned} &\min_x\quad &&c^Tx+\mathbb{E}[Q(x, \xi(\omega))]\\ &s.t.\\ &&&Ax=b\\ &&&x\geq 0 \end{aligned}$

其中， $\xi(\omega))$ 为第二段模型的最优值：

$\begin{aligned} &&&Q(x, \xi(\omega))=\min_y q(\omega)^Ty\\ s.t.\\ &&&T(\omega)x+Wy=h(\omega)\\ &&&y\geq 0 \end{aligned}$

有时候也会把上面的 $\min$ 符号写成 $\inf$ ，第二阶段模型的对偶模型为：

$\begin{aligned} &\max_\pi\quad &&\pi^T(h-Tx)\\ &s.t.\\ &&&W^T\pi\leq q\\ \end{aligned}$

更严谨的时候，可以把上面的符号 $\max$ 写成 $\sup$ 。

$\xi:=(q, h, T, W)$ ，即 $q, h, T, W$ 可能全部是随机的，也可能一部分是随机的。
两阶段或多阶段模型更抽象的写法中，用到了测度论的一些表示。

2. 多阶段规划

对于多阶段规划，数学模型中它的决策顺序与两阶段略微不一样。设阶段 $t$ 的决策为 $x_t$ ， $\xi_t$ 为随机变量。它的决策顺序为：

随机变量 $\xi_1$ 已经发生，
做出第一阶段决策 $x_1$
然后 $\xi_2$ 已经发生，
做出第二阶段决策 $x_2$
…
$\xi_T$ 已经发生，
做出第 $T$ 阶段决策 $x_T$

$\xi_t$ 可以理解为 $t - 1$ 的随机变量，上述决策过程为：在 $\xi_{t+1}$ 发生前，如何做出决策 $x_t$ 。（没有 $\xi_{T+1}$ ，因为最后一阶段的决策类似动态规划的临界方程）

决策变量 $x_t$ 也可以细分为： $t$ 阶段的状态变量与 $t$ 阶段的决策变量， $t$ 阶段的状态变量由前一阶段的状态变量与该阶段的决策变量决定。

最后一阶段 $T$ 的线性规划模型为：

$\begin{aligned} &\min_{x_T}\quad &&Q_T(x_{T-1}, \xi_T)=c^T_Tx_T\\ &s.t.\\ &&&B_Tx_{T-1}+A_Tx_T=b_T\\ &&&x_T\geq 0 \end{aligned}$

$\xi_T=(c_T, B_T, A_T, b_T)$ ，表示这几个参数的部分或全部是随机的。在最后一阶段时，上面的优化模型表示在 $x_{T-1}$ 已知，以及随机变量 $\xi_T$ 发生时，如何最小化目标函数。

$T - 1$ 阶段的线性规划模型为：

$\begin{aligned} &\min_{x_{T-1}}\quad &&Q_{T-1}(x_{T-2}, \xi_{T-1})=c^{T}_{T-1}x_{T-1}+\mathbb{E}\left[Q_T(x_{T-1}, \xi_T)|\xi_{[1, T-1]}\right]\\ &s.t.\\ &&&B_{T-1}x_{T-2}+A_{T-1}x_{T-1}=b_{T-1}\\ &&&x_{T-1}\geq 0 \end{aligned}$

$\xi_T=(c_{T-1}, B_{T-1}, A_{T-1}, b_{T-1})$ ， $\xi_{[1, T-1]}$ 表示 $T - 1$ 阶段随机变量的所有历史信息。里面的条件期望意味着从 $\xi_{[1, T-1]}$ 到 $\xi_T$ 可能涉及到随机状态的转移概率。

阶段 $\dots, T-1$ 的线性规划模型可以统一表示为：

$\begin{aligned} &\min_{x_{t}}\quad &&Q_{t}(x_{t-1}, \xi_{t})=c^{T}_{t}x_{t}+\mathbb{E}\left[Q_{t+1}(x_{t}, \xi_{t+1})|\xi_{[1, t]}\right]\\ &s.t.\\ &&&B_{t}x_{t-1}+A_{t}x_{t}=b_{t}\\ &&&x_t\geq 0 \end{aligned}$

而第一阶段的线性规划决策模型为：

$\begin{aligned} &\min_{x_{t}}\quad &&Q_{1}( \xi_{1})=c^{T}_{1}x_{1}+\mathbb{E}\left[Q_{2}(x_{1}, \xi_{2})\right]\\ &s.t.\\ &&&A_{1}x_{1}=b_{1}\\ &&&x_1\geq 0 \end{aligned}$

因为 $\xi_1$ 在做决策前就发生了，可是视为确定变量，目标函数里面就不用条件期望了。

多阶段规划的整体线性规划模型也可以表示为：

$\min_{A_1x_1=b1, ~~ x_1\geq0}\quad c^T_1x_1+\mathbb{E}\left[\min_{B_2x_1+A_2x_2=b2, ~~ x_2\geq0}\quad c^T_2x_2+\mathbb{E}\left[\dots+\mathbb{E}\left[\min_{B_Tx_{T-1}+A_Tx_T=bT, ~~ x_T\geq0}\quad c^T_Tx_T\right]\right]\right]$