区间估计

对于点估计而言,我们不能期望它能给出总体参数的精确估计值,所以经常在点估计后加一个边际误差来计算区间估计。其格式为:

点估计 ± 边际误差

比如,总体均值的区间估计可表示为: x¯±
下面,我们就总体标准差 σ 已知和未知两种情况下,对总体均值的区间估计进行讨论。

σ 已知

在一些应用中,我们抽样前可根据大量相关历史数据估计总体标准差,我们称这种情形为 σ 已知。然后我们可以根据公式 σx¯=σ/n 计算样本标准差 σx¯
借助正态分布的性质,我们可以确定区间估计的大小。比如,我们有95%的把握相信区间 (x¯1.96σx¯x¯+1.96σx¯) 包括总体平均值 μ =E(x¯) ) 。我们称这个区间是在95%置信水平下建立的,其中0.95为置信系数 (x¯σx¯x¯+σx¯) 置信区间
σ 已知的情况下总体均值的区间估计可用以下公示表示:

x¯±zα/2σn

其中 1α 为置信系数, zα/2 表示标准正态概率右侧面积为 α/2 时的 z 值。

下面是常用的置信水平下的 zα/2

置信水平 α α/2 zα/2
90%0.100.051.645
95%0.050.0251.960
99%0.010.0052.576

需要注意的是,如果总体服从正态分布,则给出的置信区间是精确的。如果总体不服从正态分布,以上方法给出的置信区间是近似的,近似程度与总体分布和样本容量有关。绝大部分应用中,样本容量 n30 已足够;如果总体分布不服从正态分布但大致堆成,样本容量至少要超过15才能得到置信区间一个好的近似。
σ 已知的情况大概讨论这些,下面看看 σ 未知的情况。

σ 未知

在实际工作中,往往总体标准差 σ 是未知的,常用样本标准差 s 作为总体标准差 σ 的估计值,可以证明 x¯μs/n 服从自由度为 n1 t 分布。x¯μs/n 这个数值相当于 σ 已知的情况下总体分布的标准 z 分数。
σ 未知的情况下总体均值的区间估计可用以下公示表示:

x¯±tα/2sn

其中 s 为样本标准差, 1α 为置信系数,自由度为 n1 t 分布中 tα/2 右侧的面积恰好是 α/2

通过查阅 t <script type="math/tex" id="MathJax-Element-1753">t</script> 分布表,即可解决此类问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值