统计学3

正态分布
这一节我们将讲统计学中最重要的概念,甚至是任何科学领域中最重要的概念,因为它在生活中无处不在,就是正态分布,或者叫高斯分布或钟形曲线

使用Excel可以说明,二项分布在试验次数足够时会很接近正态分布。从图中可以看出均值为100*0.3=30。注意K=60~100概率极低但也不为0。
这里写图片描述

正态分布的概率密度函数图像
这里写图片描述

概率密度函数 f(x)=12πσe12(xμσ)2 ,其中 xμσ 表示x离均值有多少个标准差那么远,这又称作标准z分数。注意,不只是正态分布,任何分布都有z分数,只要知道均值和标准差。

连续随机变量x在[a,b]上的概率 P(X)=baf(x)dx ,且正态分布在整个实数轴上都有意义, f(x)dx=1

比如抛硬币的例子(二项分布)中,均值为10*0.5,方差为10*0.5*0.5。 P(X=2)=0.04395
这里写图片描述
用正态分布的概率公式计算 P(1.5X2.5)=12π1.58e12(251.58)2×10.0417 (x=2的概率为高,宽为1的长方形面积,即积分的的近似),和二项分布求得的概率几乎相等,差距是0.00224。
如果试验次数更多,还会更接近,如下图试验15次,差距是0.00045。
这里写图片描述

中心极限定理:抛硬币的例子中,如果抛的足够多且每次试验相互独立,其如果正面,随机变量为1,如果反面为0。那么所有随机变量的和在抛掷次数趋于无穷时,趋于正态分布。有趣的是每次抛掷试验并非正态分布,但结果却得到正态分布。

正态分布的概率密度公式也可以改写成
f(x)=12πσe12(xμσ)2=12πσ2(e(xμσ)2)12=12πσ2ez2 ,其中 xμσ=z

正态分布的图像受均值和标准差影响
这里写图片描述


正态分布的积累分布函数 F(x)=xf(x)dx ,图像如下图。
这里写图片描述
F(2)表示小于2的概率是多少。F(1)-F(-1)表示-1到1之间的概率是多少。

哪些是正态分布?
1、某高中学生的拇指到小指的长度——近似于正态分布
2、某大型公司所有员工的工资——右偏态分布,又叫正偏态分布(尾部右侧延伸),也属于一种双峰分布
这里写图片描述
3、收银抽屉里100枚硬币的日期——左偏态分布,又叫负偏态分布(尾部左侧延伸)
这里写图片描述
右偏态分布:均值在中位数右边
左偏态分布:均值在中位数左边(均值将曲线下方面积分成相等的两部分,中位数是从小到大序列中最中间的数,因为左侧无限延伸,所以均值在中位数左边)
这里写图片描述


下面介绍经验法则,又称68-95-99.7法则。在实际应用上,常考虑一组数据具有近似于正态分布的概率分布。若其假设正确,则约 68% 数值分布在距离平均值有 1 个标准差( |z|1 )之内的范围,约 95% 数值分布在距离平均值有 2 个标准差( |z|2 )之内的范围,以及约 99.7% 数值分布在距离平均值有 3 个标准差( |z|3 )之内的范围。
这里写图片描述

最后讲两个正态分布的衡量指标——偏度和峰度。
如果是对称的正态分布,则偏度为0。如果偏度为正,则说明右侧尾部较长,得到正偏态分布,不是理想的正态分布。如果偏度为负,则说明左侧尾部较长。
峰度越大,正峰态会比实际正态分布尖的越厉害,而负峰态中间更平滑。
这里写图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值