统计学02

中心极限定理

1.定义

中心极限定理是指,样本的平均值约等于总体的平均值。不管是什么分布,任意一个总体的样本平均值都会围绕在总体的整体平均值周围,并且呈正态分布。
注意:取样本的时候,一般认为,每组大于等于30个,即可让中心极限定理发挥作用。

2.举例

假设有一个群体,如清华毕业的人,想知道这群人的收入。会进行一下四步:
第一步:抽取1个样本,包括100个人,然后对这些人的收入求平均值。
第二步:将第一步不断重复,即不断从毕业的人中抽取1000个人,例如抽取了5个样本将会得到5个平均值。样本数量即为5.
第三步:根据中心定理,这些样本平均值中的绝大部分都极为接近总体的平均收入。有一些会稍高一点,有一些会稍低一点,只有极少数的样本平均值大大高于或者低于群体平均值;
第四步:中心极限定理告诉我们,不论所研究的群体是怎样分布,这些样本平均值会在总体平均值周围呈现一个正态分布。

置信区间

1.定义

一般用中括号[a,b]表示样本估计总体平均值误差范围的区间。a、b的具体数值取决于对“该区间包含总体均值”这一结果的可信程度,因此[a,b]称为置信区间。
一般来说,选定某个置信区间,目的是为了让“ab之间包含总体平均值”的结果有一个特定的概率,这个概率就是所谓的置信水平。

2.举例

假设全国人民的身高服从正态分布:

不断进行采样,假设样本的大小为n,则样本均值为:

由大数定理和中心极限定理:

几个小问题:
1.为什么常用95%的置信水平?

2.计算置信区间的套路
1)首先明确要求解的问题,比如上例要通过样本来估计全国人民身高的平均值;
2)求抽样样本的平均值和标准误差。(标准误差和标准差是不一样的);
3)确定需要的置信水平,比如常用的是95%;
4)查z表,求z值;
5)计算置信区间
a = 样本均值 - z标准误差
b = 样本均值 + z标准误差

参考:https://blog.csdn.net/bitcarmanlee/article/details/82709774

作者:weixin_43444314
来源:CSDN
原文:https://blog.csdn.net/weixin_43444314/article/details/90181846
版权声明:本文为博主原创文章,转载请附上博文链接!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值