报童问题(3)-深入分析

本文探讨了报童模型,其中报童以批发价购买报纸,零售价出售,未售罄部分以低价卖给回收站。文章通过建立利润函数,利用随机变量D的概率分布,求解期望收益最大化的采购量x。通过求导和积分,得出最优采购量的临界值,从而找到使期望收益最大化的策略。
摘要由CSDN通过智能技术生成

先简要的回顾一下报童模型的定义和阐述:

每天早上,报童以批发价 c 元/份采购当天的报纸,然后以零售价 p 元/份售卖。如果当天报纸没有卖完,则以 s元/份的价格卖给废品回收站。不失一般性,假设 p > c > s。用随机变量 D DD 表示当天的需求量,并已知其概率分布。求使得期望收益最大的采购量x。

建立采购量为x情形下的利润函数如下:

注意:这里需要用到一个公式:
max(x,D)+min(x,D)=x+D; min(x,0)=-max(-x,0)

 这里只有一个随机变量D,只有一个需要确定的决策变量x,因此可以得到该报童期望利润为:

其中 f ( d ) f(d)f(d) 为随机变量 D 的概率密度函数。上面式子中,由于D是在0到正无穷大区间内的,因此其期望就等于从0到无穷大区间内的积分。

为了获得最大的期望收益,因此我们需要对上面的式子求解关于决策变量x的导数并令导函数其为零,这就得到了下面的式子:

  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
所谓报童问题是一个与需求有关,而需求是随机的问题。一位报童从报刊发行处订报后零售,每卖出一份可获利a元,若订报后卖不出去,则退回发行处,每份将要赔钱b元。那么报童如何根据以往的卖报情况(每天报纸的需求量为k份的概率为 )来推算出每天收益达到最大的订报量n? 算法解说分析: ① 我利用负指数分布公式“g(u)=-lg(u)”,其中“u=1.0*u/RAND_MAX(产生[0,1]均匀分布的随机数)”。函数中“g(u)=-lg(u)”的自变量“u”是均匀产生[0,1]之间的数,可知“g(u)”的函数值也是等可能的产生的,而且这些函数值是呈一种负指数分布趋向的。我可以通过一些巧妙地方法,就是让这些函数值乘上一个数值,让其不能超过1并且把这些值累加起来(今次加上上一次的),这是一个循环,结束的条件是累加的这些和的值≥1。到循环结束的时候,我可以算一下究竟循环了多少次,而这个循环了“多少次”就是我们所需要的需求量的模拟值。 ② 因为我们都知道“-lg(u)”的值是公平地呈负指数分布出现的,为何?很明显,“u=1.0*u/RAND_MAX(产生[0,1]均匀分布的随机数)”证明其“公平性”。“公平性”很重要,因为能出现通过“-lg(u)”计算得出的值必须要公平才有“可信性”。同理,“-lg(u)”乘上一个具体的数以后也是能“g(u)”的值是公平地呈负指数分布出现的“x=-1.0/t*log(u);/*产生负指数分布的随机数(t是确定的常数)*/ ” ③ 根据负指数函数的分布规律可知,每次让这些函数值缩小某个级别的时候在累加起来,直到其值“=1”才停止,其中循环的次
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱听雨声的北方汉

你的鼓励是我努力前进的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值