求总体标准差的置信区间_入门理解统计分析之置信区间

置信区间是统计学中用于估计总体参数的不确定范围,它反映了样本统计量与总体参数间的误差。大样本时,利用中心极限定理和标准误差计算置信区间,如平均身高的95%置信区间;小样本则使用T分布。置信水平越高,区间越宽,包含总体平均值的概率越大。置信区间的计算涉及样本平均值、标准误差、z或t值以及选定的置信水平。
摘要由CSDN通过智能技术生成

245db3e0662126b87a8d89b56d9ea75a.png

什么是误差范围

曾经,科学家们不承认实验可以有误差,认为所有的测量都必须是100%准确的,把任何误差都归于错误。后来人们才慢慢意识到误差永远存在,而且不可避免,即使设计再完美的实验也无法完全避免随机事件的干扰,所以做科学实验往往要测量多次,用多次结果的平均值或其他统计手段得到的计算结果,再加上一个误差范围作为最终的结果。

什么意思呢,比如马云智商是100,但其中有正负5的统计误差,所以马云的智商范围就是[100-5,100+5]这么一个范围。真实的智商值当然只有一个,但是这个数是多少,我们不知道,它可以是这个误差范围内的任何一个数字。这个区间就是置信区间,也就是误差范围。

什么是置信区间

很多时候,我们无法得到整体的情况,只能有样本的统计结果来预估整体的结果。但是样本总归不是整体,不同样本得到的结果还不同,所以样本结果和整体结果之间的误差区间,就是置信区间,

例如,我要统计中国18岁及以上年龄男性的身高均值。我们不可能去搜集全中国所有符合条件的人的身高,但是这个总体的平均值肯定存在。为了得到这个总体的信息,我们通过抽样的方法得到样本信息,然后来估计总体信息。

e01ce6e4ead50f0dc55c430e28c8d94d.png

图中每一个横短线代表一个样本的置信区间,除了一个红色的那条线,其他黑色的线都包含了总体平均值。如果我们抽了100个样本,得到100个这样的区间,其中有95个区间包含了总体样本平均值,那我们就可以说这个包含所有样本区间的某个大区间内的置信水平为95%。

换句话说,置信水平就是指区间包含总体平均值的概率p(a<样本平均值<b)=Y%

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值