统计学基础学习(二)

学习内容一:中心极限定理
定义:在一定条件下,大量独立随机变量的平均数是以正态分布为极限的。说明任意定义了良好的均值和方差的分布也有方差和标准差(离散和连续)。
注:样本容量是指从分布中抽取多少个样本值
案例分析:现在袋子里有一大堆小球,每个小球上标有一个数字,数字只能从【1,3,4,6】中取。现在随机抽取4个小球作为样本,第一次取标号为1,1,3,6四个小球,均值为2.75;第二次取标号为3,4,3,1四个小球,均值为2.75;第三次取1,1,3,6四个小球,均值为3.5,连续这样取10000次后,将其均值画图,会发现图形接近正态分布。
而且,随着样本容量的不断增大,不断求其均值或者和放在图上,无限次后,样本均值图会得到一个完美的正态分布。
随着n越大,接近也就越好。
一个分布图的偏度包括:正偏态分布和负偏态分布。正偏态分布即右偏分布,负偏态分布即左偏分布。
一个分布图的峰度包括:正峰度和负峰度。正峰度尾部较大,负峰度尾部较小。
疯狂的分布:样本容量越大,越接近标准正态分布,标准差会越小。例如:样本容量为100的比样本容量为5远离均值的概率更小,n越大,标准差越小。
样本均值抽样分布的方差等于原分布的总体方差/n
样本均值抽样分布的标准差即均值标准差等于样本均值抽样分布的方差的开方。

学习内容二:伯努利分布
定义:伯努利分布亦称“零一分布”、“两点分布”。称随机变量X有伯努利分布, 参数为p(0<p<1),如果它分别以概率p和1-p取1和0为值。伯努利分布是一个离散型机率分布,是N=1时二项分布的特殊情况。
伯努利分布均值和方差公式:
方差:离均值距离的平方的期望值 即(1-p)(0-p)2 + p(1-p)2=p-p2
均值:可能值得概率加权和 即u=(1-p) * 0 + p * 1= p
标准差=(p-p
2)的开方
学习内容三:置信区间
置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。
置信区间是一种常用的区间估计方法,所谓置信区间就是分别以统计量的置信上限和置信下限为上下界构成的区间。对于一组给定的样本数据,其平均值为μ,标准偏差为σ,则其整体数据的平均值的100(1-α)%置信区间为(μ-Ζα/2σ , μ+Ζα/2σ) ,其中α为非置信水平在正态分布内的覆盖面积 ,Ζα/2即为对应的标准分数。
如何计算置信区间:
1. 确定要求解的问题是什么;
2. 计算均值和标准误差;
3. 确定置信水平,记住置信水平越高,区间越宽,置信区间包含总体平均值统计量的概率就越大;
4. 求置信区间上下限的值。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值