在学习笔记8中介绍了机器学习结合运筹学的一阶段模型,该模型考虑了特征信息对最优决策的影响,所有的特征都是可观测到的。下面这篇文章则考虑了具有不可观测特征的报童问题。
学习笔记8——报童模型扩展(数据驱动方法SAA;大数据驱动方法ERM:机器学习和运筹学的有机结合)含gurobi求解代码
什么叫不可观测特征?举个例子,我有三个箱子,每个箱子里都有红球和白球,我现在手里有三个红球,问这三个红球是哪个箱子里的球?
我手里能看到的球就叫观测序列【红,红,红】,对应需求数据序列,即我们可以观测到的报纸的需求数据序列;
看不到的箱子的序列就叫状态序列【箱子x,箱子x,箱子x】,对应不可观测特征的序列,先不管他是啥,我只需要知道有这么一个玩意会影响需求,把它当成一列新的特征即可。
这篇文章的核心就是在一阶段模型的基础上增加了这一列不可观测特征,也就是状态序列。那么问题来了,怎么得到状态序列呢?有这么个东西叫隐马尔可夫模型(Hidden Markov Model,HMM),它有一个作用就是根据观测序列求状态序列,观测序列我们有了,不是吗?
关于更多HMM的内容请参考下面这篇文章:
一文带你了解隐马尔可夫模型https://zhuanlan.zhihu.com/p/547259609
下图是这篇文章的模型网络图,Emission Network用于接收特征数据作为输入,并输出每个状态的观测概率,这些概率随后用于HMM网络的状态估计;HMM将估计好的不可观测状态序列再输入到Newsvendor Network中,就相当于在原来一阶段模型的基础上增加了一列额外的特征,其余不变。
那么这样做效果如何呢?文章用了5个对比方法
一、EDD,等同于学习笔记8中的SAA方法不考虑特征
二、obBW,等同于学习笔记8中的两阶段模型加了一列不可观测特征
三、PfLR,等同于学习笔记8中的两阶段模型没有加不可观测特征
四、LML,等同于学习笔记8中一阶段模型没有加不可观测特征,用的线性预测模型
五、DNN,等同于学习笔记8中一阶段模型没有加不可观测特征,用的非线性预测模型深度神经网络,能够更好的拟合非线性关系
将上述5个方法和HMMNV相对于真实模型的偏差百分比可视化如下所示,由图可见本文的HMMNV取得了和真实模型差异最小的表现,进而说明了考虑不可观测特征的重要性。后面作者还进行了两两p值检验,不同方法在不同超参数下的性能对比以及真实数据的实验。
总的来说,文章考虑了不可观测特征在一阶段模型上的影响,一种不一样的思路~