征服统计学10|什么是95%置信区间?

本文详细介绍了置信区间(CI)的自举法计算过程,包括从样本中随机有放回地抽取,计算多个样本均值,以及如何构建95%置信区间。置信区间的主要作用是估计总体参数,如样本均值,并用于比较不同样本间的差异。当两组样本的置信区间无重叠时,表明它们在统计学上有显著差异。此外,置信区间还可用于判断样本是否能有效估计总体的真正值。
摘要由CSDN通过智能技术生成

本文介绍置信区间 Confidence interval,CI的自举法计算及其意义。

目录

自举法计算置信区间

自举法获取样本均值

计算置信区间

置信区间存在意义

作用一:同一组样本划定可以估计总体的区间

作用二:两组样本差异直接比较


自举法计算置信区间

置信区间(Confidence interval,CI)比较容易理解的计算方法为自举法(Bootstrap)。

  • 自举法获取样本均值

以估算一组雌鼠的体重为例快速熟悉下自举法

为了估算一组雌性小鼠(很多很多只~~不可能每一只都称量到)的体重,可通过计算12只雌性小鼠(上图红圈)样本均值,利用自举法确定一个均值范围以代表一组雌性老鼠的总体均值。

自举法实现分三步如上图:

  • 第一步、从上述12个样本中随机有放回地抽取(允许重复)12只小鼠,可以看到有的小鼠被抽了多次,有的未被抽到;
  • 第二步、计算第一步12只小鼠体重均值;
  • 第三步、重复第一步和第二步,直到我们得到足够多的均值(大于10000个)。
  • 计算置信区间

经常听到的95%置信区间(当然还有其它的置信区间,这里以95%为例)就是覆盖95%的均值(上文自举法获取的均值)的区间,上图黑色划线部分即是95%置信区间

置信区间存在意义

  • 作用一:同一组样本划定可以估计总体的区间

上图中每个红色竖线是对所有雌鼠“真实”均值(真实被引住说明无法测量,只能通过抽样推测)的估计,置信区间的作用一在于说明落在该区域的均值能够用来对所有雌鼠“真实”均值进行估计。

95%的置信区间外的任何均值发生的概率都小于5%,是P值都小于0.05的小概率事件,与置信区间呈显著差异,不能用来对所有雌鼠“真实”均值进行估计。

  • 作用二:两组样本差异直接比较

上图雌雄性老鼠样本的95%置信区间无重叠,在统计学上有显著差异,只用根据雌雄鼠的置信区间有无重叠即可判定两组鼠是否体重有差异。

但是,当两组置信区间有部分重叠时,差异性需要借助t检验了。

Reference

https://www.bilibili.com/video/BV1iJ411R7zf?p=19

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qq_21478261

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值