Khan公开课 - 统计学学习笔记:(五)正态分布

正态分布:二项分布极好的近似

X是随机变量,E(X)是期望值。正态分布(normal distribution)也称为高斯分布(Gaussian distribution),或者钟形曲线(bell curve)。

(x-μ)/σ也称为z score(注意:z score是个通用的概念,包括非正态分布)。因此正态分布公式也可以写为,一眼望去,一堆2:

二项式分布可以很好地用正太分布近似,特别是n越大,越趋于接近。我们用Excel来对两者进行对比,下图是fair coin,即p=0.5的抛投情况,给出n=4和n=10的情况,可以看出n越高,曲线就越趋同。

在一般教科书给出的正态分布中,μ=0,上面的图向左移,呈Y轴对称。标准正态分布(Standard normal distribution),即μ=0,σ=1的正态分布。

正态分布:概率

正态曲线是个连续的曲线,如果某个概率符合正态分布曲线,实际上某个区间的概率为,但很多时候直接(x2-x1)f(X),如果离散值,就是P(X),当然对于雨量这种连续分布只能说是近似,在X2-X1很小的可以。

在EXCEL中,有公式=NORMDIST(x,μ,σ,cumulative),如果cumulative选择FALSE,就是正态函数取值,如果选择TRUE,就是累积分布函数(Cumulative Distribution Function),CDF(x)=,相当于EXCEL的另一函数NORMSDIST(z)。利用EXCEL,无论正太分布的X2和X1取多少,都很容易计算在这个区间内的范围值。

累计分布函数,也可以通过根据z score查z table获得。见:http://en.wikipedia.org/wiki/Z_table

正态分布:z score和经验法则

其中以对称的μ为中心,±σ范围的概率是68.3%。也就是说z=(x-μ)/σ在范围(-1,1)内,概率为68.3%。

也就是说z在范围(-1,1)内,概率为68.3%。

所谓的经验法则(Empirical Rule),也成为68-95-99.7法则,即以μ为中心,落在μ±σ的概率为68%,落在μ±2σ的概率为95%,落在μ±3σ的概率为99.7%。

偏态和峰度

正态分布是对称的,而偏态则不是。下面分别是negative skew和positive skew。

正态分布的Kurtosis(峰度)为0,有些分布突出呈尖形,有些较扁呈圆盾形状,用Kurtosic(峰度)表示,如下,其中黑线为正态分布。

相关链接:我的四方书库

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值