1. 前言
相信有不少初学者在刚接触到标准误差时,都会有这样的疑惑。
- 标准误和标准差有什么区别呢?
- 为什么标准误等于标准差除以根号n呢?
本文将对这两个问题进行解释。
2. 标准差
标准差衡量的是每个样本到样本期望(可以理解为均值)的距离,也就是衡量样本在均值周围的波动情况,它是方差的平方。比如调查一个1000W人口的地区平均身高,我们抽取了10个样本(人),得到如下样本数据(身高,单位cm):
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
身高(cm) | 170 | 170 | 170 | 170 | 170 | 175 | 175 | 175 | 175 | 175 |
得到的均值,方差,标准差如下:
均值 | 方差 | 标准差 |
172.5 | 6.944444 | 2.635231 |
那么我们可以说,2.64的标准差显示了该样本数据围绕均值的波动情况。
3. 标准误
3.1 概念介绍
那么标准误是什么呢?同样是调查一个1000W人口的地区平均身高,我们选取10组样本(注意,这里是按组选取),每组共有10个样本,然后计算每组样本的均值后,得到共10组样本的均值,这时,该10组样本均值的标准差就是我们所说的标准误,这也是著名语句"样本均值的标准差就是样本均值的标准误"的由来。
3.2 标准误公式的由来
假设X1~ Xn是n个独立同分布的样本的均值,且X~N(μ,σ^2)
已知样本均值
那么其方差为