原创 | 有趣的等待时间悖论

f83344c91a0d6e73910a44076d9e9546.png

作者:贾恩东
本文约1500字,建议阅读5分钟
对生活中等待时间的平均值,有一个有趣的悖论,本文做一个通俗且深入的介绍。

在生活中,你可能会时常遇到如下场景:

1. 购物时排队结账;

2. 等待下一班公交或者地铁;

3. 等待下一趟电梯;

4. 开车时在路口等待红绿灯 ……

以上场景发生时,我们通常不得不选择等一会,那关于这个等待时间的平均值,其实有一个有趣的悖论,本文中作者会对其做一个通俗且深入的介绍。

严谨些的定义:

1. 在一个周期性发生的事件中,其周期不固定,但平均周期为T;

2. 你以均匀的概率选择1个时间点(比如等公交时不借助APP实时观察车到站再选择出发);

3. 你在2中所选择的时间点距离下一次事件发生的等待时间为X 则,关于这个等待时间X,我们有如下结论:

4. 乍看这个等待时间X的期望应该是T/2;

5. 我们的生活经验告诉我们,这个X的均值很可能大于T/2;

乍看为何X=T/2,其实挺显然的,因为我们不妨在区间(0,T)上以均匀分布的概率选一个点x,x到右端点的距离的期望计算如下:

236e0122c4f57a81dec04f14b0aed3a6.png 

40a0e0bf715f75ef6a884056e1997042.png

那为何我们日常的生活经验总觉得这个等待时间,经常大于事件平均周期的一半呢?是我们的错觉吗?我们不妨再用一个简单的程序模拟试试:

1. 我们假设T=10,事件发生了10000次,构建事件发生时刻的序列event_timer。

64441431dc328f88497cd23efae89e0d.png

2. 我们检查一下,这个序列中,相邻事件发生的平均间隔是否等于10。

04984fd1888333652bc7ffec0a8d70fb.png 

54a11576edff5402cbc35553aab3ae0d.png

3. 我们开始模拟等待的时间。

064b44306581b133ad86ec5c16a21e79.png 

95422bdd9257a1498b980cb4fc2656ab.png

4. 重复模拟500000次,计算等待的均值。

c8a4e88c8e71a3b645e2c1a5e54104c5.png 

e62a97b8f0146b382762f5111234534d.png

等待事件的均值居然近似等于事件的平均发生周期?说好的一半呢?

0a015b374f2f6e4e30b962f19e4cf266.png 

1466be94d13270b2408ff1fee2b53ff0.png

这就是等待时间悖论。

可能已经有聪明的读者想到是为什么了。

我们不妨再给大家举一个更容易看懂这种悖论来源的例子:你想考察一个学校的班级的平均学生数,于是就对学校的学生随机采样并询问他们的班级人数,最终对所有结果求均值。这样看起来容易,但真的没问题吗?

你会发现,学生人数更多的班级里的学生更容易被采样到,所以最终的统计结果比真实值偏大。

这种情况是由于我们的有偏采样(biased sampling)导致的。

我们不妨对之前的程序中,相邻事件发生的间隔时间画出分布直方图。我们已经知道,这个间隔的均值是T。

36c66127d03e4d29f7fa532dfdbd58e7.png 

a344786f36c6fc62b050bb4c7cecde1b.png

107f99bfb5a8a99771e6862d41359cc4.png

可以看出,这个分布很像指数分布,但其实我们在程序中,实际是把事件发生时刻做了一个均匀分布的生成,这其实就是一个泊松过程(之前作者已写过一文读懂系列中介绍过了泊松分布,这里就不再做介绍了),这个分布我们不妨写成:

2c72031bb67300b1c0c06156c5d9a4ee.png 

3d5024fde74dec06847f30d43fbe53b8.png

关于等待时间,其实就是在相邻事件间隔 t 上取 w,其概率可以如下简单得到:

b0f44decbd49086f029d336b46452423.png 

b84cd935c73f412fcc7eda5dab881748.png

可以简单假设,等待时间 w 可以和事件间隔 t 的分布一致。我们为了验证这一说法,不妨对之前仿真得到的等待时间也画出一个分布直方图。68c34d8ee4ea30b52f97ba9a04ea677f.png 

9b3f6b972b867df70f4ac72e53731d2f.png

d502c44ea915046bf616eab337134a7a.png

基本和我们大胆的推断一致。

所以等待时间的分布也是一个泊松分布,其期望就是相邻事件的间隔时间,而不是什么一半。当然了,这个假设都是建立在事件前后发生独立,事件发生时刻是一个均匀分布的前提下,即:泊松过程是一个无记忆过程。但在现实中,情况可能不会那么理想,比如,在公交或者地铁系统中,其有更具体的计划表,后一个事件的发生和前一个事件发生并非独立,因此我们的平均等待时间,会少于事件平均周期T,但却总是要大于这个平均周期的一半。

参考文章:

[1]The Waiting Time Paradox, or, Why Is My Bus Always Late? | Pythonic Perambulations (jakevdp.github.io)

编辑:于腾凯

校对:林亦霖

数据派研究部介绍

数据派研究部成立于2017年初,以兴趣为核心划分多个组别,各组既遵循研究部整体的知识分享实践项目规划,又各具特色:

算法模型组:积极组队参加kaggle等比赛,原创手把手教系列文章;

调研分析组:通过专访等方式调研大数据的应用,探索数据产品之美;

系统平台组:追踪大数据&人工智能系统平台技术前沿,对话专家;

自然语言处理组:重于实践,积极参加比赛及策划各类文本分析项目;

制造业大数据组:秉工业强国之梦,产学研政结合,挖掘数据价值;

数据可视化组:将信息与艺术融合,探索数据之美,学用可视化讲故事;

网络爬虫组:爬取网络信息,配合其他各组开发创意项目。

点击文末“阅读原文”,报名数据派研究部志愿者,总有一组适合你~

转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派THUID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

未经许可的转载以及改编者,我们将依法追究其法律责任。

26c5124464a84707005beac65375a6c4.png点击“阅读原文”加入组织~

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值