统计学——抽样与中心极限定理

1. 抽样

总体与样本

总体:总体是要研究对象的整个群体。
样本:是从总体抽取一部分出来,代表总体情况的。

样本容量:抽取这一部分的数量
样本数量:从总体抽取部分,抽取几次。

在这里插入图片描述

统计量

统计量:是对数据进行统计的量,例如:均值、方差、标准差和比例等。根据总体和样本可分为总体统计量和样本统计量。
总体统计量:对总体进行统计的量

总体均值 μ μ μ:整个研究对象数据的均值
总体方差 σ 2 σ^2 σ2:整个研究对象数据的方差

样本统计量:对样本进行统计的量

总体均值 X ˉ \bar{X} Xˉ:取部分研究对象数据的均值
总体方差 S 2 S^2 S2:取部分研究对象数据的方差

分布

总体分布:总体数据的概率分布。很多时候无法获得总体所有元素的观测值,只能通过理论计算。
样本分布:抽取的样本中数据的概率分布。样本分布与总体分布近似(抽样正确的前提下)
抽样分布:对样本统计量概率分布的一种描述:所有样本均值的概率分布。
在这里插入图片描述

抽样方法

通过科学合理的方式进行抽样,使得样本具有代表性,一般我们采用以下四种方法:
简单随机抽样:总体中每一个对象被抽中的概率相等,对总计进行随机抽取。
分层抽样:指先将总体按照某种特征分为若干层,然后再从每一层内进行简单随机抽样。
系统抽样:核心在于确定一个所谓的“抽样间隔”,通过一定的抽样间隔进行抽取。
整群抽样:将总体分成几个群,先采用简单随机抽样的方法抽取群。

2. 中心极限定理

中心极限定理:从总体中抽取容量为n的简单随机样本,当样本容量很大时,样本均值 X ˉ \bar{X} Xˉ的抽样分布近似服从正态概率分布。(样本容量>=30)

  1. 样本的平均值约等于总体平均值。
  2. 不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的平均值周围,并且呈现正态分布。

总体方差和样本方差

由中心极限定理可以得出,样本均值和总体均值是相等的。但总体方差和样本方差却不相等。这是因为我们在抽取样本的时候很难同时抽取到非常大和非常小的值,这就导致样本的离散程度小于总体的离散程度,而样本容量的增大会使得这个差距缩小。
在这里插入图片描述
总体方差

σ 2 = ∑ ( x − μ ) 2 n σ^2 = \frac{\sum{(x-μ)}^2}{n} σ2=n(xμ)2n:总体数据个数
μ:总体均值

样本方差

S 2 = ∑ ( x − X ˉ ) 2 n − 1 S^2 = \frac{\sum{(x-\bar{X})}^2}{n-1} S2=n1(xXˉ)2n:样本数据个数
X ˉ \bar{X} Xˉ:样本均值
分母用(n-1)是为了减少因样本排除异常值在外导致的与总体标准差的误差,目的是用样本方差去估计总体方差。

标准误差

标准误差其实也是标准差,只不过它是所有样本平均值的标准差。标准误差是用来衡量样本平均值的波动大小。
标准差:对方差进行开平方。
在这里插入图片描述
在这里插入图片描述

中心极限定理应用:

  1. 通过样本对总体进行估计。
  2. 验证样本是否属于总体
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIGC人工智残

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值