【统计学笔记】第七章参数估计_第七章参数估计-CSDN博客

本文链接：https://blog.csdn.net/MYMarcoreus/article/details/111398562

第七章参数估计

7.1 参数估计的基本原理

参数估计：用样本统计量去去估计总体的参数

7.1.1 估计量与估计值

估计量（ ${\hat \theta}$ ）：用于估计总体参数的随机变量
估计值：估计参数时计算出来的统计量的具体值

样本统计量（估计量） $\\$ ${\hat \theta}$	总体参数（被估计的参数） $\\$ $\theta$
$样本均值\bar x$	$总体均值\mu$
$样本比例 p$	$总体比例\pi$
$样本方差s^2$	$总体方差\sigma^2$

7.1.2 点估计和区间估计

点估计：用样本的估计量 ${\hat \theta}$ 的某个取值直接作为总体参数 $\theta$ 的估计值
- 一个具体的点估计值无法给出估计的可靠性的度量
- 由于样本是随机的，抽出一个具体的样本得到的估计值很可能不同于总体真值
区间估计：在点估计的基础上，给出总体参数估计的一个区间范围，该区间由样本统计量加减估计误差而得到
- 置信区间：由样本统计量所构造的总体参数的估计区间
  - 统计学家在某种程度上确信这个区间会包含真正的总体参数，所以取名为置信区间
  - 置信上限：置信区间的最小值
  - 置信下限：置信区间的最大值
- 置信水平（ $1-\alpha$ ）：置信区间中包含总体参数真值的次数，又称置信度或置信系数（ $\alpha$ 为是总体参数未在区间内的比例）

常用置信水平的 $z_{2/\alpha}$ 值：

置信水平	$\alpha$	$\alpha/2$	$z_{\alpha/2}$
90%	0.10	0.05	1.645（ $z_{0.05} =$ 1.645 ）
95%	0.05	0.025	1.96（ $z_{0.025} =$ 1.96）
99%	0.01	0.005	2.58（ $z_{0.005} =$ 2.58）

7.1.3 评价估计量的标准

无偏性：估计量抽样分布的数学期望等于被估计的总体参数，即 $E(\hat \theta) = \theta$ ，称 $\hat \theta 为 \theta$ 的无偏估计量。
有效性：对同一总体参数的两个无偏点估计量，有更小标准差的估计量更有效，即 $D(\hat \theta)$ 越小，估计越有效。
一致性：随着样本量的增大，估计量的值越来越接近被估计的总体参数

7.2 一个总体参数的区间估计

在这里插入图片描述

7.2.1 总体均值的区间估计

大样本
- 不论总体是不是正态分布，只要是大样本就有样本均值的标准化变量：
  $\frac{\bar x - \mu}{\sigma / \sqrt{n}} \sim N(0,1)$
  总体均值 $\mu$ 在 $1-\alpha$ 置信水平下的置信区间为：
  $\bar x \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$
  或
  $\bar x \pm z_{\alpha/2} \frac{s}{\sqrt{n}}（\sigma 未知）$
小样本
- 正态总体且总体方差 $\sigma^2$ 已知：可使用大样本中的 $z$ 分布来计算
- 正态总体且总体方差 $\sigma^2$ 未知，样本均值的标准化变量为：
  $\frac{\bar x - \mu}{s / \sqrt{n}} \sim t(n-1)$
  总体均值 $\mu$ 在 $1-\alpha$ 置信水平下的置信区间为：
  $\bar x \pm t_{\alpha/2} \frac{s}{\sqrt{n}}$

7.2.2 总体比例的区间估计

样本比例的标准化变量：
$\frac{p-\pi}{\sqrt{\pi(1-\pi)/n}{}} \sim N(0,1)$
总体比例 $\pi$ 在 $1-\alpha$ 置信水平下的置信区间为：
$\pm z_{\alpha/2} \sqrt{\frac{p(1-p)}{n}}$

7.2.3 总体方差的区间估计

样本方差的标准化变量：
$\chi^2 = \frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1)$
总体方差 $\sigma^2$ 在 $1-\alpha$ 置信水平下的置信区间为：
$\chi_{1-\alpha/2}^2 \le \frac{(n-1)s^2}{\sigma^2} \le \chi_{\alpha/2}^2$
$\frac{(n-1)s^2}{\chi_{\alpha/2}^2} \le \sigma^2 \le \frac{(n-1)s^2}{\chi_{1-\alpha/2}^2}$

7.3 两个总体参数的区间估计

在这里插入图片描述

7.3.1 两个总体均值之差的区间估计

独立样本
如果两个样本是从两个不同的总体中独立抽取的，就称为独立样本。
1. 大样本：只要是大样本就有标准化变量：
  $\frac{(\bar x_1 - \bar x_2)-(\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n2}}} \sim N(0,1)$
  总体均值之差 $\mu_1 - \mu_2$ 在 $1-\alpha$ 置信水平下的置信区间为：
  $(\bar x_1 - \bar x_2)\pm z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}$
  或
  $(\bar x_1 - \bar x_2)\pm z_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}(\sigma未知时)$
2. 小样本：两个总体需要服从正态分布
  - 当两个总体方差 $\sigma_1^2$ 和 $\sigma_2^2$ 已知时：可使用大样本中的 $z$ 分布来计算
  - 当两个总体方差 $\sigma_1^2$ 和 $\sigma_2^2$ 未知时：
    - $\sigma_1^2 = \sigma_2^2$ 时：
      总体方差的合并估计量：
      
      总体均值之差 $\mu_1 - \mu_2$ 在 $1-\alpha$ 置信水平下的置信区间为：
    - $\sigma_1^2$ $\ne$ $\sigma_2^2$ 时：
      自由度v：
      总体均值之差 $\mu_1 - \mu_2$ 在 $1-\alpha$ 置信水平下的置信区间为：
匹配样本
$d和d_i：两个匹配样本差值$
$\bar d：全部匹配样本差值的均值$
$\sigma_d：总体各差值的标准差$
$s_d：样本差值的标准差$
1. 大样本
  两个总体均值之差 $\mu_d = \mu_1 - \mu_2$ 在 $1-\alpha$ 置信水平下的置信区间为：
  $\bar d \pm z_{\alpha/2} \frac{\sigma_d}{\sqrt{n}}$
2. 小样本：两个总体各观察值的配对差服从正态分布
  两个总体均值之差 $\mu_d = \mu_1 - \mu_2$ 在 $1-\alpha$ 置信水平下的置信区间为：
  $\bar d \pm t_{\alpha/2}(n-1) \frac{s_d}{\sqrt{n}}$

7.3.2 两个总体比例之差的区间估计

- 标准化变量：
- 两个总体比例之差 $\pi_1 - \pi_2$ 在 $1-\alpha$ 置信水平下
  的置信区间为：

7.3.3 两个总体方差比的区间估计

这里面的 $F_{\alpha/2}$ 和 $F_{1-\alpha/2}$ 都是服从分子自由度为 $n_1-1$ 和分母自由度为 $n_2-1$ 的F分布的分位数。

标准化变量：
$\frac{s_1^2}{s_2^2} \cdot \frac{\sigma_2^2}{\sigma_1^2} \sim F(n_1-1, n_2-1)$
因为：
$F_{1-\alpha/2} \le F \le F_{\alpha/2}$
有:
$F_{1-\alpha/2} \le \frac{s_1^2}{s_2^2} \cdot \frac{\sigma_2^2}{\sigma_1^2} \le F_{\alpha/2}$
所以总体方差比 $\sigma_1^2/\sigma_2^2$ 在 $1-\alpha$ 置信水平下的置信区间为：
$\frac{{s_1^2}/{s_2^2}}{F_\alpha/2} \le \frac{\sigma_1^2}{\sigma_2^2} \le \frac{{{s_1^2}/{s_2^2}}}{F_{1-\alpha/2}}$
根据 $F_{\alpha/2}$ 求 $F_{1-\alpha/2}$ ：
$F_{1-\alpha/2}(n_1,n_2) = \frac{1}{F_{\alpha}(n_2, n_1)}$