区间估计

最新推荐文章于 2024-08-24 21:23:14 发布

理由过于天真

最新推荐文章于 2024-08-24 21:23:14 发布

阅读量5.4k

点赞数 1

分类专栏：统计学

统计学专栏收录该内容

7 篇文章 0 订阅

订阅专栏

对于点估计而言，我们不能期望它能给出总体参数的精确估计值，所以经常在点估计后加一个边际误差来计算区间估计。其格式为：

点估计 $\pm$ 边际误差

比如，总体均值的区间估计可表示为： $\bar{x} \pm 边际误差$ 。
下面，我们就总体标准差 $\sigma$ 已知和未知两种情况下，对总体均值的区间估计进行讨论。

$\sigma$ 已知

在一些应用中，我们抽样前可根据大量相关历史数据估计总体标准差，我们称这种情形为 $\sigma$ 已知。然后我们可以根据公式 $\sigma_{\bar{x}}=\sigma/\sqrt{n}$ 计算样本标准差 $\sigma_{\bar{x}}$ 。
借助正态分布的性质，我们可以确定区间估计的大小。比如，我们有95%的把握相信区间 $(\bar{x}-1.96\sigma_\bar{x} ， \bar{x}+1.96\sigma_\bar{x})$ 包括总体平均值 $\mu$ （ $=E(\bar{x})$ ）。我们称这个区间是在95%置信水平下建立的，其中0.95为置信系数， $(\bar{x}-\sigma_\bar{x} ， \bar{x}+\sigma_\bar{x})$ 为置信区间。
$\sigma$ 已知的情况下总体均值的区间估计可用以下公示表示：

$\bar{x} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$
其中 $1-\alpha$ 为置信系数， $z_{\alpha/2}$ 表示标准正态概率右侧面积为 $\alpha/2$ 时的 $z$ 值。

下面是常用的置信水平下的 $z_{\alpha/2}$ ：

置信水平	$\alpha$	$\alpha/2$	$z_{\alpha/2}$
90%	0.10	0.05	1.645
95%	0.05	0.025	1.960
99%	0.01	0.005	2.576

需要注意的是，如果总体服从正态分布，则给出的置信区间是精确的。如果总体不服从正态分布，以上方法给出的置信区间是近似的，近似程度与总体分布和样本容量有关。绝大部分应用中，样本容量 $n\geq 30$ 已足够；如果总体分布不服从正态分布但大致堆成，样本容量至少要超过15才能得到置信区间一个好的近似。
$\sigma$ 已知的情况大概讨论这些，下面看看 $\sigma$ 未知的情况。

$\sigma$ 未知

在实际工作中，往往总体标准差 $\sigma$ 是未知的，常用样本标准差 $s$ 作为总体标准差 $\sigma$ 的估计值，可以证明 $\frac{\bar{x}-\mu}{s/ \sqrt{n}}$ 服从自由度为 $n-1$ 的 $t$ 分布。 $\frac{\bar{x}-\mu}{s/ \sqrt{n}}$ 这个数值相当于 $\sigma$ 已知的情况下总体分布的标准 $z$ 分数。
$\sigma$ 未知的情况下总体均值的区间估计可用以下公示表示：