10.第四章区间估计(1)

最新推荐文章于 2024-07-30 15:40:41 发布

江景页

最新推荐文章于 2024-07-30 15:40:41 发布

阅读量1.4k

点赞数

分类专栏：《数理统计》学习笔记文章标签：概率论

本文链接：https://blog.csdn.net/jingye333/article/details/108524800

版权

《数理统计》学习笔记专栏收录该内容

21 篇文章

订阅专栏

第四章区间估计(1)

1.区间估计的基本概念

区间估计，指用一个误差限 $d(\boldsymbol X)$ 作为点估计的偏离限度，将 $g(\theta)$ 的取值限制在 $[\hat g(\boldsymbol X)-d(\boldsymbol X),\hat g(\boldsymbol X)+d(\boldsymbol X)]$ 之中。更一般地，取两个具有确定大小关系的统计量 $\hat g_1(\boldsymbol X)\le \hat g_2(\boldsymbol X)$ ，将 $[\hat g_1(\boldsymbol X),\hat g_2(\boldsymbol X)]$ 作为参数 $g(\theta)$ 的区间估计。与点估计不同，点估计不可能取到实际参数值，但区间估计却存在包含实际参数值的可能；从定义也可以看出，区间估计依赖于好的点估计。

评价区间估计优劣主要有两个指标：可靠度，精度。

可靠度：待估参数 $g(\theta)$ 被包含在区间 $[\hat g_1(\boldsymbol X),\hat g_2(\boldsymbol X)]$ 的可能性大小；
精度：区间的平均长度 $E_\theta(\hat g_2(\boldsymbol X)-\hat g_1(\boldsymbol X))$ 。
一般来说，在样本大小固定时，提高可靠度意味着降低精度，反之也成立。构造可靠度和精度都尽可能高的方法通常采用Neyman原则，即在保证可靠度达到指定要求的前提下尽可能提高精度。

为了衡量区间估计的可靠度，将随机取件 $[\hat \theta_1,\hat\theta_2]$ 包含待估参数 $\theta$ 的概率称为置信度（置信系数），即置信度为 $\mathbf P\{\theta\in [\hat \theta_1,\hat\theta_2]\}$ 。然而置信度是依赖于未知参数 $\theta$ 的，而我们在估计时仅仅知道 $\theta$ 是个定值却不知道它到底是多少，所以我们要对整个样本空间 $\Theta$ 上的参数确定置信度，将所有置信度的下确界定为这个区间估计的置信系数，即
$\inf_{\theta\in\Theta}\mathbf P_\theta(\hat\theta_1\le\theta\le\hat \theta_2)$
可以看出，用置信系数衡量区间估计的可靠度就与未知参数无关，而单单说置信度（置信水平），是依赖于未知参数的。如果要计算区间估计的置信水平或置信系数，就需要相关统计量的精确分布或渐进分布。

2.置信区间、置信限与置信域

Neyman准则要求在可靠度达到一定要求的前提下，尽可能地缩短区间估计的长度，因此需要引入置信区间的概念。对给定的 $0<\alpha<1$ 与区间估计 $[\hat \theta_1(\boldsymbol X),\hat \theta_2(\boldsymbol X)]$ ，有
$\mathbf P_\theta(\hat \theta_1(\boldsymbol X)\le\theta\le\hat \theta_2(\boldsymbol X))\ge1-\alpha,\forall \theta\in\Theta\\ 即\inf_{\theta\in\Theta}\mathbf P_\theta(\hat \theta_1(\boldsymbol X)\le\theta\le\hat \theta_2(\boldsymbol X))\ge1-\alpha$
则称 $[\hat \theta_1(\boldsymbol X),\hat\theta_2(\boldsymbol X)]$ 是 $\theta$ 的置信水平为 $1-\alpha$ 的置信区间，即置信系数不小于 $1-\alpha$ 的区间估计。

置信区间是一种双边区间估计，而如果只关心未知参数的单边估计，就用到置信限。置信限的定义与区间估计类似，分为置信上限 $\hat \theta_U(\boldsymbol X)$ 和置信下限 $\hat \theta_L(\boldsymbol X)$ ，分别要求在给定的置信系数 $1-\alpha$ 下，有
$\mathbf P_\theta(\theta\le\hat \theta_U(\boldsymbol X))\ge1-\alpha, \forall \theta\in\Theta\\ \mathbf P_\theta(\theta\ge\hat \theta_L(\boldsymbol X))\ge1-\alpha,\forall \theta \in \Theta$
并且可以推论，对于 $\hat \theta_L(\boldsymbol X)\le\hat \theta_U(\boldsymbol X)$ ，如果 $\hat \theta_L(\boldsymbol X)$ 是置信水平 $1-\alpha_1$ 的置信下限， $\hat \theta_U(\boldsymbol X)$ 是置信水平为 $1-\alpha_2$ 的置信上限，则 $[\hat \theta_L(\boldsymbol X),\hat \theta_U(\boldsymbol X)]$ 是置信水平为 $1-\alpha_1-\alpha_2$ 的双侧置信区间。

置信域将置信区间与置信限的概念拓展到参数 $\theta$ 是多维（设为 $k$ 维）的情形。设有一个参数分布族 $\mathscr F=\{f(x,\boldsymbol \theta), \boldsymbol \theta \in\Theta\},\boldsymbol \theta=(\theta_1,\cdots,\theta_k)\in \Theta \subset \mathbf R^k$ 。若统计量 $S(\boldsymbol X)$ 满足对任何样本 $\boldsymbol X$ 有 $S(\boldsymbol X)\subset\Theta$ ，且 $\mathbf P_\boldsymbol \theta(\boldsymbol \theta\in S(\boldsymbol X))\ge1-\alpha,\forall \boldsymbol \theta\in\Theta$ ，则称 $S(\boldsymbol X)$ 是 $\boldsymbol \theta$ 的置信水平为 $1-\alpha$ 的置信域。