机器学习|区间估计（置信区间基本概念+一般解法）（一）| 15mins 入门 |概统学习笔记（二十七）

本文链接：https://blog.csdn.net/SanyHo/article/details/105282394

统计推断的基本问题

（1）参数估计问题：总体X的分布函数的形式已知，但它的一个或多个参数为未知，需要借助于X的样本来估计它们。有两种形式：点估计和区间估计

（2）假设检验问题：总体X的分布函数的形式完全未知，或只知其形式，但不知其参数，为了推断总体的某些未知特性，提出某些关于总体的假设。

区间估计

引入：点估计值仅仅是未知参数的一个近似值，它没有反映出这个近似值的误差范围，使用起来把握不大。而区间估计正好弥补了点估计的这个缺陷。

譬如，在估计湖中鱼数的问题中，若根据一个实际样本，得到鱼数N的极大似然估计为1000条，实际上，N的真值可能大于1000条，也可能小于1000条，若能给出一个区间，使我们能以比较高的可靠程度相信它包含真参数值。

在这里插入图片描述
这里所说的”可靠程度“是用概率来度量的，称为置信概率，置信度或置信水平

习惯上把置信水平记作 $1-\alpha$ ，这里 $\alpha$ 是一个很小的正数。

置信水平的大小是根据实际需要选定的。
一、置信区间的基本概念

置信区间的定义：

设 $\theta$ 是一个待估参数，给定 $\alpha>0$ ，若由样本 $X_1,X_2,...,X_n$ 确定的两个统计量 $\hat \theta_1=\hat \theta_1(X_1,X_2,...,X_n),\hat \theta_2=\hat \theta_2(X_1,X_2,...,X_n)(\hat \theta_1<\hat \theta_2)$ 满足
$P\{\hat \theta_1\leq \theta \leq \hat \theta_2\}=1-\alpha$
则称区间 $[\hat \theta_1,\hat \theta_2]$ 是 $\theta$ 的置信水平（置信度、置信概率）为 $1-\alpha$ 的置信区间， $\hat \theta_1$ 和 $\hat \theta_2$ 分别称为置信下限和置信上限。通常可取置信水平 $1-\alpha=0.95$ 或 $0.9$ 等。

可见，对参数 $\theta$ 作区间估计，就是要设法找出两个只依赖于样本的界限（构造统计量）
$\hat \theta_1=\hat \theta_1(X_1,...,X_n) \\ \hat \theta_2=\hat \theta_2(X_1,...,X_n)$
其中 $\hat \theta_1 < \hat \theta_2$ ，一旦有了样本，就把 $\theta$ 估计在区间 $[\hat \theta_1, \hat \theta_2]$ 内。
要求：
1. 要求 $\theta$ 以很大的可能被包含在区间 $[\hat \theta_1，\hat \theta_2]$ 内，就是说，概率 $P\{\hat \theta_1\leq \theta\leq \hat \theta_2\}$ 要尽可能大。即要求估计尽量可靠。
2. 估计的精度要尽可能的高。如要求区间长度 $\hat \theta_2 - \hat \theta_1$ 尽可能短，或能体现该要求的其它准则。
3. 可靠度与精度是一对矛盾，一般是在保证可靠度的条件下，尽可能提高精度。
寻找置信区间的方法，一般是从确定误差限入手。

我们选取未知参数的某个估计量 $\hat \theta$ ,根据置信水平 $1-\alpha$ ,可以找到一个正数 $\delta$ ，使得
$P\{|\hat \theta-\theta|\leq \delta\}=1-\alpha$
称 $\delta$ 为 $\hat \theta$ 与 $\theta$ 之间的误差限。

只要知道 $\hat \theta$ 的概率分布，确定误差限并不难。

由不等式 $|\hat \theta - \theta|\leq \delta$ 可以解出 $\theta$ ：
$\hat \theta-\delta \leq \theta \leq \hat \theta + \delta$
这个不等式就是我们所求的置信区间。

二、置信区间的求法

一般步骤：
1. 明确问题，是求什么参数的置信区间？置信水平 $1-\alpha$ 是多少？
2. 寻找参数 $\theta$ 的一个良好的点估计
  $T(X_1,X_2,...,X_n)$
3. 寻找一个待估参数 $\theta$ 和估计量 $T$ 的函数 $S(T,\theta)$ ，且其分布为已知。称 $S(T,\theta)$ 为枢轴量。
4. 对于给定的置信水平 $1-\alpha$ ，根据 $S(T,\theta)$ 的分布，确定常数 $a 、 b$ ，使得
  $P(a\leq S(T,\theta)\leq b)=1-\alpha$
5. 对" $\alpha\leq S(T,\theta) \leq b$ "作等价变形，得到如下形式：
  $P\{\hat \theta_1 \leq \theta \leq \hat \theta_2\}=1-\alpha$
  则 $[\hat \theta_1, \hat \theta_2]$ 就是 $\theta$ 的 $100(1-\alpha)\%$ 的置信区间