标准误(Standard Error)

 

 

1.标准误概念

标准误是数据统计的重点概念,且难以理解。百度上文章缺乏详细描述的文章。所以写下此文让读者能够彻彻底底了解标准误概念。

标准误全称:样本均值的标准误(Standard Error for the Sample Mean),顾名思义,标准误是用于衡量样本均值和总体均值的差距。

2.标准误意义:

用于衡量样本均值和总体均值的差距有多大?

标准误越小----样本均值和总体均值差距越小

标准误越大----样本均值和总体均值差距越大

标准误用于预测样本数据准确性 ,标准误越小,样本均值和总体均值差距越小,样本数据越能代表总体数据。

3.标准误与标准差区别:

对一个总体多次抽样,每次样本大小都为n,那么每个样本都有自己的平均值,这些平均值的标准差叫做标准误。

标准差是单次抽样得到的,用单次抽样得到的标准差可以估计多次抽样才能得到的标准误差

标准差表示数据离散程度:

标准差越大,分布越广,集中程度越差,均值代表性越差

标准差越小,分布集中在平均值附近,均值代表性更好

 

标准差与标准误不同应用范围:
标准差:(图左)在正负两个标准差(95%概率下),Jack消耗时间在68-132秒之间。
标准误:(图右)在正负两个标准误,Jack消耗平均时间大约在95-105秒之间。

 

4.标准误计算例子

什么是真实的标准误?举个例子,对一个总体12次抽样,生成12个样本,每个样本大小都为5。那么每个样本都有自己的平均值,这些平均值的标准差叫做标准误差。这里就是对表格最后一行数组计算标准差(100,101,99,114,103.....93),最后算出来标准误结果为6.33。

 

但是为了得到标准误,我们不可能做很多次科学实验。实际上我们可以做一次样本实验,然后采用估算公式:

 

 

如下图,我们用第一组样本估算真实标准误,此样本标准差除以根号n,结果为7.16, 然后把7.16约等为真实的标准误6.33。

所以标准误也是另外一种形式的标准差,标准误和总体标准差既有相似处,又有区别。标准误是一个比较难得概念,读者一次不能很好理解,如果反复看此文章,然后自己动手程序模拟,就会增强直观印象,加深理解。

 

所有的随机样本中,如果数量相同,它们的标准误默认为近似相同(非真正相同)

 

5.标准误的应用
我们有两组数据,一组观看了指导视频,一组没有观看指导视频,比较两组数据在得分方面有无显著差异?

随着样本量不同,我们得到的结果不同。图左,两组数据没有区别,图中两组数据可能有区别,可能没有;图右两组数据有区别
样本量为3时,看视频组的2*标准误为15,没看视频的2*标准误为13。

样本量小时,标准误很大,样本均值和总体均值差异很大,样本数据的代表性很差。

 

样本量为5时,看视频组的2*标准误为9,没看视频的2*标准误为10。

样本量增大后,标准误变小。

 

样本量为10时,看视频组的2*标准误为7,没看视频的2*标准误为6。
样本量增大后,标准误再次变小

 

随着样本量不同,我们得到的结果不同。下面的图左(样本量为3),两组数据没有区别,图中(样本量为5)两组数据可能有区别,可能没有;图右(样本量为10)两组数据有区别
实际上,众多毕业论文和专业期刊的统计分析都是错的,虽有华丽的可视化图表,但新手很容易因样本量太小得到错误结果。

 

6.蒙特卡洛模拟

蒙特卡洛验证,对一组样本进行标准误评估,看公式SE = s/√(n)是否准确

结果表明SE = s/√(n)公式得到的标准误和真实标准误非常接近

 

样本值100,标准误很小,大约0.1

 

样本值10,标准误增大,大约0.33

 

样本值5,标准误再次增大,大约0.45

 

源代码如下

问题反馈邮箱231469242@qq.com

# -*- coding: utf-8 -*-

import random,math

import numpy as np

n=1000

normal_population=list(np.random.normal(size=n))

mean_population=np.mean(normal_population)

#总体标准差

sigma=np.std(normal_population,ddof=0)

#存放多个随机样本

list_samples=[]

#多个随机样本的平均数

list_samplesMean=[]

#求单个样本估算的标准误

def Standard_error(sample):

    std=np.std(sample,ddof=0)

    standard_error=std/math.sqrt(len(sample))

    return standard_error

#求真实标准误

def Standard_error_real():

    for i in range(100):

        sample=random.sample(normal_population,100)

        list_samples.append(sample)

    list_samplesMean=[np.mean(i) for i in list_samples]

    standard_error_real=np.std(list_samplesMean,ddof=0)

    return standard_error_real 

#plt.hist(normal_values)

#真实标准误

standard_error_real=Standard_error_real()

print(standard_error_real)

#随机抽样

print(Standard_error(list_samples[0]))

print(Standard_error(list_samples[1]))

print(Standard_error(list_samples[2]))

End.

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在统计学中,标准误是指一种用于估计统计量的标准差的方法。它是在一个统计量的总体的样本的基础上计算的,并且反映了这个样本的不确定性。标准误可以用来估计统计量在整个总体中的分布,并且可以用来制定置信区间。 有时候人们会误解标准误,例如认为标准误是统计量的误差,或者认为标准误反映了数据本身的不确定性,但这都是错误的。标准误只是一种估计统计量分布的方法,并不能真正反映数据本身的不确定性。 ### 回答2: 统计学中的标准误Standard Error)是用于衡量样本均值或其他统计指标估计值的不确定性的一个测量标准。它是一个表示测量误差的度量,衡量样本均值等估计值与总体参数的差异。 标准误是样本中观察值和总体参数之间的差异的标准差。它通过计算样本观察值的变异性来估计总体参数的不确定性。标准误越低,估计值的稳定性就越高,反之亦然。 计算标准误的方法取决于估计值的类型。对于估计样本均值的标准误,可以使用样本标准差除以样本大小的平方根来计算。标准差衡量了样本中每个观察值与样本均值之间的离散程度,而样本大小的平方根衡量了样本的规模。 标准误的应用广泛,尤其在统计推断中起着重要作用。通过计算标准误,可以构建置信区间和进行假设检验。置信区间提供了总体参数值的估计范围,并揭示了估计值的不确定性。假设检验则用于评估估计值与理论预期值之间的差异是否显著。 需要注意的是,标准误是对估计值的不确定性的度量,与抽样误差不同。抽样误差是由于样本选择可能导致的不准确估计的误差,而标准误是估计值的不确定性的测量。 总之,标准误在统计学中是一种用于衡量样本估计值的不确定性的测量标准。它的使用可以帮助研究人员对估计值的准确性进行评估,并在统计推断中提供重要的信息。 ### 回答3: 统计学中的标准误Standard Error)是指样本统计量与总体参数之间的差异的一种度量方式。它用于衡量样本统计量的变异程度,并且可以帮助我们估计总体参数的不确定性。 标准误的计算方法根据不同的统计量而异。对于样本均值的标准误,通常计算公式是样本标准差除以样本容量的平方根。标准差衡量了观察值与均值之间的离散程度,而样本容量的平方根反映了样本中的观察值数量。 标准误的大小与样本容量密切相关。当样本容量增加时,标准误会减小,表示样本均值的估计值更加可靠。相反,当样本容量较小时,标准误会增大,表示估计的不确定性更大。 标准误在统计推断中扮演重要的角色。通过计算标准误,我们可以计算出置信区间,以估计总体参数的范围。例如,对于样本均值的标准误,一般会基于样本均值与标准误的乘积,构建一个范围,在这个范围内我们有一定的置信度(通常是95%)可以包含总体均值。 此外,标准误还可以用于计算统计假设检验中的检验统计量。例如,在比较两个样本均值是否有统计显著差异时,可以计算出两个样本均值差异的标准误,进而计算出检验统计量。通过与临界值的比较,可以得出是否拒绝原假设的结论。 总之,统计学中的标准误作为样本统计量的不确定性度量,对于估计总体参数以及进行统计推断具有重要作用。同时,需要注意标准误的计算方法与样本容量之间的关系,以及标准误在构建置信区间和进行假设检验中的应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值