统计学的Python实现-008:标准误差

作者:长行

时间:2019.03.09

标准误差:标准误差是用以衡量统计量的可靠性的统计量;统计量(通常是参数的估计)的标准误差(stand error,SE)是其抽样分布的标准差或该标准差的估计值;如果它衡量的统计量为均值,则该标准误差称为均值的标准误差(standard error of the mean,SEM)。

统计学解释

总体均值的标准误差的计算公式:
KaTeX parse error: Got function '\overline' with no arguments as subscript at position 13: SEM=\sigma_\̲o̲v̲e̲r̲l̲i̲n̲e̲{x}=\frac{\sigm…

其中 σ \sigma σ为总体标准差, n n n为样本量

但是因为在实际测测量中总体标准差很难获得,所以在实际操作中,我们通常用样本标准差代替总体标准差来估计总体均值的标准误差。于是又总体均值的标准误差的估计公式:
KaTeX parse error: Got function '\overline' with no arguments as subscript at position 13: SEM=\sigma_\̲o̲v̲e̲r̲l̲i̲n̲e̲{X}\approx\frac…
其中 S S S为样本标准差, n n n为样本量

样本均值的标准误差的计算公式:
KaTeX parse error: Got function '\overline' with no arguments as subscript at position 4: S_\̲o̲v̲e̲r̲l̲i̲n̲e̲{X}=\frac{S}{\s…
其中 S S S为样本标准差, n n n为样本量

我们也可以尝试从另外一个角度来理解均值的标准误差。当我们在一组数据中随机抽取一个数作为样本的时候,样本均值的离散程度服从总体的标准差;但是当我们从这一组数据中抽取多个数作为样本的时候,样本均值的离散程度就会小于总体的标准差,而均值的标准误差就是衡量这组样本均值此时标准差的统计量。

实现代码

计算总体均值的标准误差
import numpy
import math
data_test=[1,1,2,2,3,4,4,5,5]
SD_P=numpy.std(data_test,ddof=0)
n=len(data_test)
print(SD_P/math.sqrt(n))

结果

0.49690399499995325
估计总体均值的标准误差 + 计算样本均值的标准误差
import numpy
import math
data_test=[1,1,2,2,3,4,4,5,5]
SD_S=numpy.std(data_test,ddof=1)
n=len(data_test)
print(SD_S/math.sqrt(n))

结果

0.5270462766947299
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

长行

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值