随机过程:更新过程(renewal process)例题

文章通过一个公交站台的随机过程模型来分析每辆公交车的平均载客数量和长期平均等待的乘客数。利用泊松过程描述乘客到达,更新过程描述公交车到达,通过条件期望和更新报酬定理计算出每辆车的平均载客数和平均乘客数,涉及到概率论和随机过程的知识。
摘要由CSDN通过智能技术生成

更新过程(renewal process)例题

随机过程期末复习的时候看到的,记录一下。

题目描述: 有一公交车站台,乘客按照参数 λ \lambda λ泊松到达,等待下一辆公交车到来。公交车按照分布为F的更新过程到达(i.e. 相邻两个公交车的到达间隔时间服从F分布),且一旦达到,接走所有正在等待的乘客。假设乘客到达的泊松过程与公交车达到的更新过程是独立的。问:

  1. 每辆车平均的载客数量;
  2. 长期来看,平均等车的乘客数;

解答:

  1. 记每辆车的载客数量为 X X X,那么我们要求的是 E [ X ] E[X] E[X]。另相邻两辆车的达到时间间隔为 T T T,则 T ∼ F T \sim F TF。给定时间 T T T,那么 X ∼ P o i s s o n ( λ T ) X \sim Poisson(\lambda T) XPoisson(λT)(泊松分布的性质),即:
    E [ X ∣ T ] = λ T \begin{equation} E[X|T] = \lambda T \end{equation} E[XT]=λT
    由条件期望公式得:
    E [ X ] = E [ E [ X ∣ T ] ] = λ E [ T ] \begin{equation} E[X]= E[E[X|T]] = \lambda E[T] \end{equation} E[X]=E[E[XT]]=λE[T]
    每辆车平均载客数为 λ E [ T ] \lambda E[T] λE[T]

  2. 将以上过程建模为更新报酬过程(renewal reward process)。假设,每一位乘客只要在等待,他就支付1块钱(e.g. 某乘客等待时间为30分钟,那么他每分钟支付1块钱,共支付30块钱)。那么,每一时刻,我们获得报酬的rate等于处于等待中的顾客数,根据更新报酬定理
    平均乘客数 = 平均报酬 = E [ 一个周期内的报酬 ] E [ 周期长度 ] \begin{equation} \text{平均乘客数}=\text{平均报酬} = \frac{E[\text{一个周期内的报酬}]}{E[\text{周期长度}]} \end{equation} 平均乘客数=平均报酬=E[周期长度]E[一个周期内的报酬]
    记一个周期内的报酬为 R R R,给定该周期的到达人数 N = n N=n N=n以及该周期长度 T = t T=t T=t,该周期平均报酬为:
    E [ R ∣ N = n , T = t ] = n ∫ 0 t 1 t ( t − x ) d x = n t 2 \begin{equation} E[R|N=n, T=t] = n \int_0^t \frac{1}{t}(t-x) dx = \frac{nt}{2} \end{equation} E[RN=n,T=t]=n0tt1(tx)dx=2nt
    上式的第一个“ = = =”是因为:给定时间 t t t,已知泊松过程发生了事件 n n n,那么这 n n n次事件是均匀分布在 [ 0 , t ] [0,t] [0,t]上的。由条件期望公式得(取两次期望):
    E [ R ] = E [ N T ] 2 = 1 2 E [ E [ N T ∣ T ] ] = 1 2 λ E [ T 2 ] \begin{equation} E[R] = \frac{E[NT]}{2} = \frac{1}{2} E[E[NT|T]] = \frac{1}{2} \lambda E[T^2] \end{equation} E[R]=2E[NT]=21E[E[NTT]]=21λE[T2]
    因此,
    平均乘客数 = E [ R ] E [ T ] = λ E [ T 2 ] 2 E [ T ] \begin{equation} \text{平均乘客数}= \frac{E[R]}{E[T]} = \frac{\lambda E[T^2]}{2E[T]} \end{equation} 平均乘客数=E[T]E[R]=2E[T]λE[T2]

Remarks:

  1. 上题改编自Ross的《Introduction to probability models》第12版;
  2. 书上提问的是第二问,作业里面是第一问。看书的时候,我把第二个问当第一问做了。这两个其实是不同的概念。第一问是 average over one cycle,第二问是average over all time
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值