统计学-task2

中心极限定理

1.定义

中心极限定理是指,样本的平均值约等于总体的平均值。不管是什么分布,任意一个总体的样本平均值都会围绕在总体的整体平均值周围,并且呈正态分布。
注意:取样本的时候,一般认为,每组大于等于30个,即可让中心极限定理发挥作用。

2.举例

假设有一个群体,如清华毕业的人,想知道这群人的收入。会进行一下四步:
第一步:抽取1个样本,包括100个人,然后对这些人的收入求平均值。
第二步:将第一步不断重复,即不断从毕业的人中抽取1000个人,例如抽取了5个样本将会得到5个平均值。样本数量即为5.
第三步:根据中心定理,这些样本平均值中的绝大部分都极为接近总体的平均收入。有一些会稍高一点,有一些会稍低一点,只有极少数的样本平均值大大高于或者低于群体平均值;
第四步:中心极限定理告诉我们,不论所研究的群体是怎样分布,这些样本平均值会在总体平均值周围呈现一个正态分布。

置信区间

1.定义

一般用中括号[a,b]表示样本估计总体平均值误差范围的区间。a、b的具体数值取决于对“该区间包含总体均值”这一结果的可信程度,因此[a,b]称为置信区间。
一般来说,选定某个置信区间,目的是为了让“ab之间包含总体平均值”的结果有一个特定的概率,这个概率就是所谓的置信水平。

2.举例

假设全国人民的身高服从正态分布:
在这里插入图片描述
不断进行采样,假设样本的大小为n,则样本均值为:
在这里插入图片描述
由大数定理和中心极限定理:
在这里插入图片描述
几个小问题:
1.为什么常用95%的置信水平?
在这里插入图片描述
2.计算置信区间的套路
1)首先明确要求解的问题,比如上例要通过样本来估计全国人民身高的平均值;
2)求抽样样本的平均值和标准误差。(标准误差和标准差是不一样的);
3)确定需要的置信水平,比如常用的是95%;
4)查z表,求z值;
5)计算置信区间
a = 样本均值 - z标准误差
b = 样本均值 + z
标准误差

参考https://blog.csdn.net/bitcarmanlee/article/details/82709774

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值