如何理解置信区间

置信区间,就是一种区间估计。

先来看看什么是点估计,什么是区间估计。


1 点估计与区间估计

以前很流行一种刮刮卡:

游戏规则是(假设只有一个大奖):

  • 大奖事先就固定好了,一定印在某一张刮刮卡上

  • 买了刮刮卡之后,刮开就知道自己是否中奖

那么我们起码有两种策略来刮奖:

  • 点估计:买一张,这就相当于你猜测这一张会中奖

  • 区间估计:买一盒,这就相当于你猜测这一盒里面会有某一张中奖

很显然区间估计的命中率会更高(当然费用会更高,因为风险降低了)。

接下来,我们看看置信区间是如何进行区间估计的。


2 置信区间

我们通过对人类身高的估计来讲解什么是置信区间。

2.1 上帝视角

对于人类真实的平均身高,我们是没有办法知道的,因为几乎不可能把每个人都统计到。

但这个数据肯定是真实存在的,我们可以说,上帝知道。

在这里我们引入了上帝视角,即上帝看到的人类身高的真实分布。

假设人类的身高分布服从如下正态分布():

也就是说全体人类的平均身高为145cm,为了表示只有上帝可以看到,我把真实分布用虚线来表示:

2.2 点估计

作为愚蠢的人类,我们只能在人群中抽样统计:

比如下面是一次抽样数据,我把算出来的样本均值(记作)画在图上(蓝色的点):

就是对真实的的一次点估计。

通过一次次的抽样,我们可以算出不同的身高均值的点估计:

如果我们关闭上帝视角,我们分辨不出哪个点估计更好:

区间估计可以改进此问题。

2.3 置信区间

置信区间,提供了一种区间估计的方法。

下面采用置信区间来构造区间估计(什么是置信区间,这个我们后面解释):

通过置信区间构造出来的区间,我们可以看到,基本上都包含了真实的,除了红色的那根。

关闭上帝视角,我们仍然不知道哪一个区间估计更好:

但是,和点估计比较:

  • 点估计和区间估计,都不知道哪个点或者哪个区间更好

  • 但是,按照置信区间构造出来的区间,随便选一个区间,有的概率会包含

这就好像用渔网捞鱼,我知道每一网下去有的几率捞到想要的那条鱼,但是并不知道是不是现在这一网:

剩下的问题就是置信区间是如何构造的。

置信区间

假设人群的身高服从:

其中未知,已知。

我们不断对人群进行采样,样本的大小为,样本的均值:

根据大数定律和中心极限定律,服从:

我们可以算出以为中心,面积为0.95的区间,如下图:

即:

也就是,的几率落入此区间:

 

那自然,我们以为半径做区间,有的概率把包含进去:

那么,只有一个问题了,我们不知道、并且永远都不会知道真实的是多少。

我们就只有用来代替


4 总结

总结一下:

  • 置信区间要求估计量是个常数

  • 也被称为置信水平,是统计中的一个习惯,可以根据应用进行调整

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

马同学图解数学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值