【库存笔记5】Optimal Dynamic Scheduling Policy for a Make-To-Stock Production System-CSDN博客

本文链接：https://blog.csdn.net/zte10096334/article/details/102555781

背景模型


主题	动态调度问题 (dynamic scheduling problem)
模型	$$
生产系统	2个产品	生产时间：指数分布，均值 $1/{\mu_i}$
需求	2个产品的需求, 各自满足 Poisson 分布	第 $i$ 类需求的rate: $\lambda_i$
成本	单位产品库存持有成本 $h_i$	单位产品延迟交付成本 $b_i$
管理目标	调度生产，在两种产品的 costs 之间取得平衡

DP模型

标记	含义
$X_i(t)$	产品 $i$ 在 $t$ 时刻的库存水平
$X(t)=(X_1(t),X_2(t))$	系统状态
$h(X(t))=\mathop{\sum}\limits_{i=1}^2h_iX_i(t)^++b_iX_i(t)^-$	库存成本函数
{ 不生产，生产产品1，生产产品2 }	策略集，用0,1,2表示
$u(t)\in\{0,1,2\}$	在 $t$ 时刻的策略

优化问题模型：
$f(x)=f(x_1,x_2)=\min_u E_x^u\left[ \int_0^{\infty} e^{-\alpha t} h(X(t)) dt \right]$ 其中 $x=(x_1,x_2)$ 为初始库存水平， $E_x^u$ 是对需求计算期望。

最优解满足下面的HJB方程：
$f(x_1,x_2)=h(x_1,x_2)+\lambda_1 f(x_1-1,x_2)+\lambda_2 f(x_1, x_2-1) \qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad$ $\min \left [ (\mu_1+\mu_2)f(x_1,x_2), \mu_1 f(x_1+1,x_2)+\mu_2 f(x_1,x_2), \mu_1 f(x_1,x_2)+\mu_2 f(x_1,x_2+1) \right ]$ 这种方程的核心就是 $\sum 转移概率 * 新状态下的cost函数$

$\cdot$ $\lambda_1 f(x_1-1,x_2)$ ，其中 $\lambda_1$ 为销售产品1的速率（状态转移概率）， $f(x_1-1,x_2)$ 为销售产品1后的状态 cost 函数
$\cdot$ $(\mu_1+\mu_2)f(x_1,x_2)$ ，对应的是 action = 0，也就是不生产的策略，转移概率为 $\mu_1+\mu_2$
$\cdot$ 在每个时刻，只能采取一种 action，所以对三种策略的 cost 要取 $\min$ ，而不是求和