统计学的Python实现-008：标准误差

长行

已于 2023-04-24 08:48:11 修改

阅读量6.5k

点赞数 2

分类专栏：数据分析文章标签： python 统计学标准误差标准误

于 2020-05-20 12:09:14 首次发布

本文链接：https://blog.csdn.net/Changxing_J/article/details/106232936

版权

数据分析同时被 2 个专栏收录

64 篇文章

订阅专栏

统计学的Python实现

20 篇文章

订阅专栏

作者：长行

时间：2019.03.09

标准误差：标准误差是用以衡量统计量的可靠性的统计量；统计量（通常是参数的估计）的标准误差（stand error，SE）是其抽样分布的标准差或该标准差的估计值；如果它衡量的统计量为均值，则该标准误差称为均值的标准误差（standard error of the mean，SEM）。

统计学解释

总体均值的标准误差的计算公式：
$KaTeX parse error: Got function '\overline' with no arguments as subscript at position 13: SEM=\sigma_\̲o̲v̲e̲r̲l̲i̲n̲e̲{x}=\frac{\sigm…$

其中 $\sigma$ 为总体标准差， $n$ 为样本量

但是因为在实际测测量中总体标准差很难获得，所以在实际操作中，我们通常用样本标准差代替总体标准差来估计总体均值的标准误差。于是又总体均值的标准误差的估计公式：
$KaTeX parse error: Got function '\overline' with no arguments as subscript at position 13: SEM=\sigma_\̲o̲v̲e̲r̲l̲i̲n̲e̲{X}\approx\frac…$
其中 $S$ 为样本标准差， $n$ 为样本量

样本均值的标准误差的计算公式：
$KaTeX parse error: Got function '\overline' with no arguments as subscript at position 4: S_\̲o̲v̲e̲r̲l̲i̲n̲e̲{X}=\frac{S}{\s…$
其中 $S$ 为样本标准差， $n$ 为样本量

我们也可以尝试从另外一个角度来理解均值的标准误差。当我们在一组数据中随机抽取一个数作为样本的时候，样本均值的离散程度服从总体的标准差；但是当我们从这一组数据中抽取多个数作为样本的时候，样本均值的离散程度就会小于总体的标准差，而均值的标准误差就是衡量这组样本均值此时标准差的统计量。

实现代码

计算总体均值的标准误差

import numpy
import math
data_test=[1,1,2,2,3,4,4,5,5]
SD_P=numpy.std(data_test,ddof=0)
n=len(data_test)
print(SD_P/math.sqrt(n))

结果

0.49690399499995325

估计总体均值的标准误差 + 计算样本均值的标准误差

import numpy
import math
data_test=[1,1,2,2,3,4,4,5,5]
SD_S=numpy.std(data_test,ddof=1)
n=len(data_test)
print(SD_S/math.sqrt(n))

结果

0.5270462766947299