从总体中随机抽取样本的目的_【知识】单个总体均值的估计

单个总体均值的区间估计和相应的蒙特卡罗模拟

设想一下这样的场景:现有一大批零件,我们想了解这批零件的某个特性(比如长度)的平均值,该用什么办法呢?如果全部测量将会耗费大量人力物力,现实的做法往往是从中随机抽取少量的零件进行测量,根据获得的样本数据估计总体均值。本文讨论具有类似性质的问题,即如何根据样本观测值估计总体均值。

ae1b11025c69832b17bae0cef568bbc6.png

01

总体均值的置信区间

   大样本

当样本数量n≥30时,该样本可视为大样本。根据中心极限定理,选择标准正态随机变量Z作为枢轴统计量,则总体均值的区间估计方法如下:

822c9ff947ed637aa4fd35d019ecdd8d.png

在大多数情况下,总体标准差σ是未知的,因此通常使用样本标准差s作为总体标准差的估计量,下同。

   小样本

如果样本属于小样本,并且总体近似正态分布,可以使用T统计量做为枢轴统计量,此时总体均值的区间估计方法如下:

fc6fccef70b53bb0682bf8dc608a4030.png

注意:对于小样本,当总体严重偏离正态分布时,这种估计方法可能存在偏差,推荐使用其他的估计方法。

02

蒙特卡罗模拟

   小样本估计总体均值

1)总体为正态分布

假设总体是均值为5,方差为1的正态分布,从中随机抽取10个样本,试根据样本观测值求总体均值的95%的置信区间。

①生成随机数(每次试验生成10个观测值,进行100个重复试验)

eb2033709653db7120af41340e35b358.png

②根据规则构造总体均值的置信区间,检查成功捕获的区间比例

可以发现,成功捕获总体的区间在95%左右

2171538e77a9b7f8c70ceaf08c880370.gif

2)总体为指数分布(严重偏离正态性)

假设总体是均值为5的指数分布,从中随机抽取10个样本,试根据样本观测值求总体均值的95%的置信区间。

①生成随机数

1c8bbb2aef548b66048b13ef91a2083f.png

②根据规则构造置信区间,检查成功捕获总体均值的区间比例

从结果来看,成功捕获总体均值的区间比例很可能小于95%

0d0e5ddbcbba79d407783911de15af0b.gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值