NOTE【数据分析】使用样本对整体进行估计

本文介绍了如何使用样本数据来估计总体的平均值和标准差。中心极限定理表明,样本平均值在总体平均值附近呈正态分布,样本大小越大,分布越接近。样本标准差通常小于总体标准差,并用于估计样本平均值的波动。此外,通过比较样本标准差与总体平均值的距离,可以判断样本是否来自同一总体。
摘要由CSDN通过智能技术生成

样本数量:从总体中抽取了几个样本

样本大小:这个样本中包含了多少个数据

 

1. 用样本来估计总体平均值

中心极限定理:

任何样本的平均值约等于总体的平均值。(前提是样本大小达到30%)

无论总体是什么分布,所有样本的平均值会在总体平均值周围呈现正态分布,样本大小越大就越接近于正态分布。

演示中心极限定理的游戏:http://onlinestatbook.com/stat_sim/sampling_dist/index.html

例如:抽取5个样本,每个样本有100个数据,用这100个数据求出每个样本的平均值,这5个样本的平均值都接近于总体的平均值。且这5个平均值会在总体平均值周围呈现正态分布,样本大小越大就越接近于正态分布。

2. 用样本来估计整体标准差(数值与平均值偏离程度)

样本标准差要小于整体标准差,所以公式中是除以(n-1)。

3. 根据总体信息,判断某个样本是否属于总体

标准差和标准误差

标准误差用来衡量样本平均值的波动大小。

标准误差也是标准差,只不过它的计算对象是所有样本平均值。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值