95%置信区间的含义_如何理解 95% 置信区间?

置信区间是统计学中的一种区间估计方法,相较于点估计,它提供了更高的估计准确率。95%置信区间意味着在多次重复实验中,大约有95%的区间会包含真实值。通过抽样和正态分布理论,可以构造出置信区间,例如对于服从正态分布的数据,可以使用标准误差计算95%置信区间。虽然我们无法确定具体哪次的区间会覆盖真实值,但总体上,置信区间为统计推断提供了更为稳健的估计。
摘要由CSDN通过智能技术生成

置信区间,就是一种区间估计。

先来看看什么是点估计,什么是区间估计。

1 点估计与区间估计

以前很流行一种刮刮卡:

游戏规则是(假设只有一个大奖):大奖事先就固定好了,一定印在某一张刮刮卡上

买了刮刮卡之后,刮开就知道自己是否中奖

那么我们起码有两种策略来刮奖:点估计:买一张,这就相当于你猜测这一张会中奖

区间估计:买一盒,这就相当于你猜测这一盒里面会有某一张中奖

很显然区间估计的命中率会更高(当然费用会更高,因为风险降低了)。

接下来,我们看看置信区间是如何进行区间估计的。

2 置信区间

我们通过对人类身高的估计来讲解什么是置信区间。

2.1 上帝视角

对于人类真实的平均身高,我们是没有办法知道的,因为几乎不可能把每个人都统计到。

但这个数据肯定是真实存在的,我们可以说,上帝知道。

在这里我们引入了上帝视角,即上帝看到的人类身高的真实分布。

假设人类的身高分布服从如下正态分布(

equation?tex=%5Cmu+%3D145%2C%5Csigma+%3D1.4 ):

equation?tex=X+%5Csim+N%28145%2C+1.4%5E2%29%5C%5C

也就是说全体人类的平均身高为145cm,为了表示只有上帝可以看到,我把真实分布用虚线来表示:

2.2 点估计

作为愚蠢的人类,我们只能在人群中抽样统计:

比如下面是一次抽样数据,我把算出来的样本均值(记作

equation?tex=%5Chat%7B%5Cmu+%7D )画在图上(蓝色的点):

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值