前面我们使用的分布都是基于有限样本的经验观察,因此称为经验分布(empirical distribution)。在经验分布之外还有分析分布(analytic distribution),分析分布的CDF(累积分布函数)是一个数学函数,分析分布可以用作经验分布的建模。
指数分布
指数分布的CDF为:
CDF(x)=1−e−λx
参数λ决定了分布的形状。下图展示了当λ=0.5、1和2时CDF的形状。
图1 不同参数的指数分布的CDF
现实世界中,如果我们观察一系列事件,对事件发生的时间间隔,即到达间隔(interarrival time)进行测量,可能会得到指数分布。
举例说明,我们看看婴儿出生的到达时间间隔。1997年12月18日,澳大利亚布里斯班的一家医院有44个婴儿出生,当地报纸报道了这些婴儿的出生时间。下图展示出生间隔的CDF。
图2 出生间隔CDF
如果认为一个数据集是指数分布,那么绘制其CDF补函数时,预期看到的函数将是:
y≈e−λx
两边取对数,得到:
logy≈−λx
下图展示婴儿出生间隔的CDF补函数:
图3 出生间隔以log-y为纵轴的CDF
上图中的线不是很直,说明指数分布并不是这组数据的完美模型。参数