区间估计
9.1 引言
前面讨论过参数 θ \theta θ的点估计,那里的推断是猜测一个单个值作为 θ \theta θ的值,这一章我们讨论区间估计及更一般的集合估计。
集合估计问题中的推断就是陈述 θ ∈ C \theta\in C θ∈C,其中 C ⊂ Θ C\subset\Theta C⊂Θ并且 C = C ( X ) C=C(\mathbf X) C=C(X)是一个由观测数据 X = x \mathbf X=\mathbf x X=x的值决定的集合。
定义9.1.1 一个实值参数 θ \theta θ的区间估计是样本的任意一堆函数 L ( x 1 , ⋯ , x n ) L(x_1, \cdots,x_n) L(x1,⋯,xn)和 U ( x 1 , ⋯ , x n ) U(x_1,\cdots, x_n) U(x1,⋯,xn),对于所有的 x ∈ X \mathbf x \in \mathcal X x∈X满足 L ( x ) ⩽ U ( x ) L(\mathbf x)\leqslant U(\mathbf x) L(x)⩽U(x). 如果观测到样本 X = x \mathbf X=\mathbf x X=x,就做出推断 L ( x ) ⩽ θ ⩽ U ( x ) L(\mathbf x)\leqslant \theta\leqslant U(\mathbf x) L(x)⩽θ⩽U(x). 随机区间 [ L ( x ) , U ( x ) ] [L(\mathbf x), U(\mathbf x)] [L(x),U(x)]叫做区间估计量。
使用区间估计而不使用点估计,目的在于对于捕获感兴趣的参数有某种保证。这个保证的确定是用以下定义量化的。
定义9.1.4 对于一个对参数 θ \theta θ的区间估计量 [ L ( x ) , U ( x ) ] [L(\mathbf x), U(\mathbf x)] [L(x),U(x)], [ L ( x ) , U ( x ) ] [L(\mathbf x), U(\mathbf x)] [L(x),U(x)]的覆盖概率是指随机区间 [ L ( x ) , U ( x ) ] [L(\mathbf x), U(\mathbf x)] [L(x),U(x)]覆盖真实参数 θ \theta θ的概率。在符号上记作 P θ ( θ ∈ [ L ( x ) , U ( x ) ] ) P_{\theta}\ \ (\theta\in [L(\mathbf x), U(\mathbf x)]) Pθ (θ∈[L(x),U(x)]).
定义9.1.5 对于一个参数 θ \theta θ的区间估计量 [ L ( x ) , U ( x ) ] [L(\mathbf x), U(\mathbf x)] [L(x),U(x)], [ L ( x ) , U ( x ) ] [L(\mathbf x), U(\mathbf x)] [L(x),U(x)]的置信系数是指覆盖概率的下确界 i n f θ P θ ( θ ∈ [ L ( x ) , U ( x ) ] ) inf_{\theta}\ P_{\theta} \ \ (\theta\in [L(\mathbf x), U(\mathbf x)]) infθ Pθ (θ∈[L(x),U(x)])
因为我们不知道
θ
\theta
θ的真实值,所以我们只能保证一个覆盖概率的下确界,即置信系数。在某些情况这并不紧要,因为覆盖概率是
θ
\theta
θ的一个常数函数。而某些情况,覆盖概率可能随
θ
\theta
θ不同而有很大变化。