中心极限定理
比如,我们想了解一家工厂所生产的鸡胸肉是否安全,我们会怎么做?
抽样调查,通过抽样检测这家工厂生产的100块鸡胸肉的沙门氏菌我们就可以知道结论。
问题是,我们一概而论的强大能力,到底是从哪来的?
绝大部分来自中心极限定理,中心极限定理是许多统计活动的动力源泉,
这些统计活动存在着一个共同的特点,那就是使用样本对一个更大的数据集进行推理。
那么能够体会出的要义就是:一个大型样本的正确抽样与其代表的群体存在着相似关系。
中心极限定理的推理:
- 如果我们掌握了某个群体的具体信息,就能推断出从这个群体中正确抽取的随机样本的情况。
- 如果我们掌握了某个正确抽取的样本的具体信息(平均数和标准差),就能对其所代表的群体做出令人惊讶的准确推理。
- 如果我们掌握了某个样本数据,以及某个群体的数据,就能推理出该样本是否就是该群体的样本之一。
- 如果我们已知两个样本的基本特征,就能推理出这两个样本是否取至同一个群体。
从中心极限定理我们可以得知
- 如果从某个研究群体中多次随机抽取数量足够多的样本,那么这些样本的平均值会以整体平均值为中心呈正态分布。(不论该群体自身的分布情况是怎样的)
- 绝大多数的样本平均值都会紧紧围绕在整体平均值的周围,通过计算标准误差就可以知道这些样本平均值到底是离得近还是远。
- 通过中心极限定理,我们便可知道样本平均值与整体平均值之间距离的远近及其概率。样本平均值离整体平均值两个标准误差的概率相对较低,3个及其以上标准误