为什么样本大小很重要

最新推荐文章于 2024-11-02 09:10:11 发布

梦想画家

最新推荐文章于 2024-11-02 09:10:11 发布

阅读量2.5k

点赞数 1

分类专栏：人工智能文章标签：置信水平置信度置信区间

本文链接：https://blog.csdn.net/neweastsun/article/details/124531488

版权

人工智能专栏收录该内容

89 篇文章

订阅专栏

样本大小指在一次实验研究中参与个体或收集记录的数量。样本大小很重要，因为它会直接影响估计总体参数的精度。本文针对该主题，通过示例让你对样本大小、置信度、置信区间有基本的理解。

什么是置信区间

实际应用中通常对衡量总体参数感兴趣，总体参数是描述总体的一些特征。

假如我们想了解某个地区所有人员的平均身高。但如果对每个人进行测量太费时费力，通常做法是从总体随机抽取一些样本，然后使用样本估计总体参数。
举例，我们在城市中随机抽取100人，收集样本的身高数据。然后计算样本的平均身高，但我们不能确定样本均值就是总体均值。当然样本选取要有代表性，不能产生幸存者偏差，本文不讨论样本抽取方法。

考虑到不确定性，我们可以使用置信区间。置信区间是包含具有一定置信水平的总体参数值范围。

总体均值置信区间计算公式：

置信区间 = $\overline{x} +/- z*(s/\sqrt{n})$