这个问题的最佳答案是需要更多关于这个问题的信息:随着日期的临近,人们越来越不可能买票(而且买的东西也越来越多)?有没有广告事件会暂时影响销售率?等等。在
但是,我们无法获得这些信息,所以我们假设,作为第一个近似值,售票率是恒定的。因为销售基本上是随机发生的,所以最好用Poisson process来建模。注意,这并不能解释很多人会购买不止一张票的事实,但我认为这不会对结果产生多大影响;也许一个真正的统计学家可以在这里插话。另外:我将在这里讨论恒定速率的Poisson过程,但是请注意,既然您提到速率绝对不是常数,那么下一步您可以研究可变速率Poisson过程。在
要对泊松过程进行建模,您只需要平均机票销售率。在您的示例数据中,每天的销售额为[15,5,5,5,16],因此平均价格约为每天9.2张票。我们已经卖了46张票,剩下254张了。在
从这里可以很容易地问,“如果每天9.2张票,那么在23天内卖出少于254张票的概率有多大?”(忽略你卖不到300多张票的事实)。计算这一点的方法是使用累积分布函数(参见poisson分布的CDF的here)。在
平均而言,我们预计在23天后会卖出23*9.2=211.6张票,所以用概率分布的语言来说,期望值是211.6。CDF告诉我们,“给定一个期望值λ,看到一个值的概率是多少<;=x”。你可以自己计算,也可以让scipy帮你做:>>> import scipy.stats
>>> scipy.stats.poisson(9.2 * 23).cdf(254-1)
0.99747286634158705
因此,这告诉我们:如果门票销售可以准确地表示为一个泊松过程,如果平均售票率真的是9.2 tpd,那么在23天之后至少有一张票可用的概率是99.7%。在
现在假设有人想带50个朋友组成一个小组,并且想知道如果他们在25天内购买了50张票,那么他们获得全部50张票的概率是多少(将问题改为“如果我们平均预期能卖出9.2*25张票,那么卖出的概率是多少?<;=(254-50)张票?”)公司名称:
^{pr2}$
所以25天后有50张票的概率约为4%。在