先简要的回顾一下报童模型的定义和阐述:
每天早上,报童以批发价 c 元/份采购当天的报纸,然后以零售价 p 元/份售卖。如果当天报纸没有卖完,则以 s元/份的价格卖给废品回收站。不失一般性,假设 p > c > s。用随机变量 D DD 表示当天的需求量,并已知其概率分布。求使得期望收益最大的采购量x。
建立采购量为x情形下的利润函数如下:
注意:这里需要用到一个公式:
max(x,D)+min(x,D)=x+D; min(x,0)=-max(-x,0)
这里只有一个随机变量D,只有一个需要确定的决策变量x,因此可以得到该报童期望利润为:
其中 f ( d ) f(d)f(d) 为随机变量 D 的概率密度函数。上面式子中,由于D是在0到正无穷大区间内的,因此其期望就等于从0到无穷大区间内的积分。
为了获得最大的期望收益,因此我们需要对上面的式子求解关于决策变量x的导数并令导函数其为零,这就得到了下面的式子: