Khan公开课 - 统计学学习笔记:(五)正态分布

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/flowingflying/article/details/8035529

正态分布:二项分布极好的近似

X是随机变量,E(X)是期望值。正态分布(normal distribution)也称为高斯分布(Gaussian distribution),或者钟形曲线(bell curve)。

(x-μ)/σ也称为z score(注意:z score是个通用的概念,包括非正态分布)。因此正态分布公式也可以写为,一眼望去,一堆2:

二项式分布可以很好地用正太分布近似,特别是n越大,越趋于接近。我们用Excel来对两者进行对比,下图是fair coin,即p=0.5的抛投情况,给出n=4和n=10的情况,可以看出n越高,曲线就越趋同。

在一般教科书给出的正态分布中,μ=0,上面的图向左移,呈Y轴对称。标准正态分布(Standard normal distribution),即μ=0,σ=1的正态分布。

正态分布:概率

正态曲线是个连续的曲线,如果某个概率符合正态分布曲线,实际上某个区间的概率为,但很多时候直接(x2-x1)f(X),如果离散值,就是P(X),当然对于雨量这种连续分布只能说是近似,在X2-X1很小的可以。

在EXCEL中,有公式=NORMDIST(x,μ,σ,cumulative),如果cumulative选择FALSE,就是正态函数取值,如果选择TRUE,就是累积分布函数(Cumulative Distribution Function),CDF(x)=,相当于EXCEL的另一函数NORMSDIST(z)。利用EXCEL,无论正太分布的X2和X1取多少,都很容易计算在这个区间内的范围值。

累计分布函数,也可以通过根据z score查z table获得。见:http://en.wikipedia.org/wiki/Z_table

正态分布:z score和经验法则

其中以对称的μ为中心,±σ范围的概率是68.3%。也就是说z=(x-μ)/σ在范围(-1,1)内,概率为68.3%。

也就是说z在范围(-1,1)内,概率为68.3%。

所谓的经验法则(Empirical Rule),也成为68-95-99.7法则,即以μ为中心,落在μ±σ的概率为68%,落在μ±2σ的概率为95%,落在μ±3σ的概率为99.7%。

偏态和峰度

正态分布是对称的,而偏态则不是。下面分别是negative skew和positive skew。

正态分布的Kurtosis(峰度)为0,有些分布突出呈尖形,有些较扁呈圆盾形状,用Kurtosic(峰度)表示,如下,其中黑线为正态分布。

相关链接:我的四方书库

展开阅读全文

没有更多推荐了,返回首页