11.第四章区间估计(2)

区间估计与枢轴变量法

最新推荐文章于 2024-10-14 16:43:06 发布

原创最新推荐文章于 2024-10-14 16:43:06 发布 · 4k 阅读

18 ·

CC 4.0 BY-SA版权

文章标签：

#概率论

《数理统计》学习笔记专栏收录该内容

21 篇文章

订阅专栏

本文详细介绍了枢轴变量法在区间估计中的应用，包括正态分布、非正态分布下的参数估计，以及利用大样本方法进行置信区间的构建。通过具体案例，如指数分布、均匀分布、柯西分布等，展示了如何选取合适的枢轴变量来解决参数估计问题。

第四章区间估计(2)

1.枢轴变量法概述

枢轴变量法的核心在于从点估计入手构造置信区间，将点估计 $T(X)T(\boldsymbol X)$ 与参数 $θ\theta$ 复合在一起成为一个变量 $φ(T,θ)\varphi(T,\theta)$ ，要求它的表达式与未知参数 $θ\theta$ 有关，但是分布却与参数无关。由于枢轴变量的表达式与参数有关，因而不是统计量，只能说这是一种构造区间估计的方法。

具体的枢轴变量法步骤是：

找到一个待估参数 $μ\mu$ 的良好点估计 $T(X)T(\boldsymbol X)$ ；
构造出一个表达式与待估参数有关的函数 $φ(T,μ)\varphi(T,\mu)$ ，使得其分布与参数无关；
对给定 $0<α<10<\alpha<1$ ，找到两个常数 $a, b$ 使得 $Pμ(a≤φ(T,μ)≤b)=1−α\mathbf P_\mu(a\le\varphi(T,\mu)\le b)=1-\alpha$ ；
解不等式 $a≤φ(T,μ)≤ba\le \varphi(T,\mu)\le b$ ，得到 $μ^1(X)≤μ≤μ^2(X)\hat \mu_1(\boldsymbol X)\le\mu\le\hat \mu_2(\boldsymbol X)$ ，这就是所需要的置信区间。

2.正态分布的枢轴变量法

对于单正态总体 $N(μ,σ2)N(\mu,\sigma^2)$ ，记 $Xˉ=1n∑i=1nXi,S2=1n−1∑i=1n(Xi−Xˉ)2\bar X=\frac1n\sum_{i=1}^nX_i,S^2=\frac1{n-1}\sum_{i=1}^n(X_i-\bar X)^2$ ，要求参数置信水平为 $1−α1-\alpha$ 的双侧置信区间。这里用 $u_p$ 表示标准正态分布的上 $p$ 分位数， $t_n(p)$ 表示 $t_n$ 分布的上 $p$ 分位数，用 $χn2(p)\chi^2_n(p)$ 表示 $χn2\chi^2_n$ 分布的上 $p$ 分位数。有以下这些情况：

$σ2\sigma^2$ 已知，求 $μ\mu$ ：由于 $Xˉ∼N(μ,σ2/n)\bar X\sim N(\mu,\sigma^2/n)$ ，所以
$\frac{\sqrt n(\bar X-\mu)}{\sigma}\sim N(0,1)\\ 即[\bar X-\frac{\sigma}{\sqrt n}u_{\alpha/2},\bar X+\frac{\sigma}{\sqrt n}u_{\alpha/2}]$
$σ2\sigma^2$ 未知，求 $μ\mu$ ：由于 $n(Xˉ−μ)σ∼N(0,1),(n−1)S2σ2∼χn−12\frac{\sqrt n(\bar X-\mu)}{\sigma}\sim N(0,1),\frac{(n-1)S^2}{\sigma^2}\sim \chi^2_{n-1}$ ，所以
$\frac{\sqrt n(X-\mu)}{S}\sim t_{n-1}\\ 即[\bar X-\frac{S}{\sqrt n}t_{n-1}(\alpha/2),\bar X+\frac{S}{\sqrt n}t_{n-1}(\alpha/2)]$
$μ\mu$ 已知，求 $σ2\sigma^2$ ：此时找到 $σ2\sigma^2$ 的无偏估计 $Sn2=1n∑i=1n(Xi−μ)2S_n^2=\frac1n\sum_{i=1}^n(X_i-\mu)^2$ ，且 $nSn2σ2∼χn2\frac{nS_n^2}{\sigma^2}\sim \chi^2_n$ ，所以
$\frac{nS_n^2}{\sigma^2}\sim \chi^2_n\\ 即[\frac{nS_n^2}{\chi^2_n(\alpha/2)},\frac{nS^2_n}{\chi^2_n(1-\alpha/2)}]$
$μ\mu$ 未知，求 $σ2\sigma^2$ ：由于 $(n−1)S2σ2∼χn−12\frac{(n-1)S^2}{\sigma^2}\sim \chi^2_{n-1}$ ，所以
$\frac{(n-1)S^2}{\sigma^2}\sim \chi^2_{n-1}\\ 即[\frac{(n-1)S^2}{\chi^2_{n-1}(\alpha/2)},\frac{(n-1)S^2}{\chi^2_{n-1}(1-\alpha/2)}]$
以上两种情况，对于 $σ\sigma$ 直接将上下界开方即可。

对于双正态总体 $Xm∼N(a,σ12),Yn∼N(b,σ22)\boldsymbol X_m\sim N(a,\sigma_1^2),\boldsymbol Y_n\sim N(b,\sigma_2^2)$ ，且二者相互独立。记 $Xˉ=1m∑i=1nXi,Yˉ=1n∑j=1nYj,Sm2=1m−1∑i=1m(Xi−Xˉ)2,Sn2=1n−1∑j=1n(Yi−Yˉ)2\bar X=\frac1m\sum_{i=1}^n X_i,\bar Y=\frac1n\sum_{j=1}^nY_j,S_m^2=\frac1{m-1}\sum_{i=1}^m(X_i-\bar X)^2,S_n^2=\frac1{n-1}\sum_{j=1}^n(Y_i-\bar Y)^2$ 。有均值差和方差比两种可以估计的参数。

对于均值差 $b - a$ 的估计，有以下几种情况：

$m = n$ ，即两组样本对称时，令 $Z_i=Y_i-X_i$ ，有 $Zi∼N(b−a,σ12+σ22)Z_i\sim N(b-a,\sigma^2_1+\sigma_2^2)$ ，转化为单变量均值估计问题。
$σ12,σ22\sigma_1^2,\sigma_2^2$ 已知时， $Yˉ−Xˉ∼N(b−a,σ12m+σ22n)\bar Y-\bar X\sim N(b-a,\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n})$ ，标准化即可作为枢轴量。
当 $σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2$ 但未知时，取联合方差 $S_w^2$ 为
$S_w^2=\frac1{m+n-2}\left[\sum_{i=1}^n(X_i-\bar X)^2+\sum_{j=1}^n (Y_i-\bar Y)^2\right]\\ T_w=\frac{(\bar Y-\bar X)-(b-a)}{T_w}\sqrt{\frac{mn}{m+n}}\sim t_{m+n-2}$
可以取 $T_w$ 作为枢轴量。
当 $σ12≠σ22\sigma_1^2\ne \sigma_2^2$ 均未知时，可使用大样本方法，取
$\tilde U=\frac{(\bar Y- \bar X)-(b-a)}{\sqrt{S_1^2/m+S_2^2/n}}\stackrel{\mathscr L}{\longrightarrow}N(0,1)$
小样本情形用到非中心 $t$ 分布。

对于方差比 $σ12/σ22\sigma_1^2/\sigma_2^2$ ，有以下几种情况：

当 $a, b$ 已知时，记 $Sa2=∑i=1m(Xi−a)2m,Sb2=∑j=1n(Yi−b)2nS_a^2=\frac{\sum_{i=1}^m (X_i-a)^2}{m},S_b^2=\frac{\sum_{j=1}^n (Y_i-b)^2}{n}$ ，则有 $mSa2/σ12∼χm2,nSb2/σ22∼χn2mS_a^2/\sigma_1^2\sim \chi_m^2,nS_b^2/\sigma_2^2\sim \chi^2_n$ ，于是
$F=\frac{S_a^2/\sigma_1^2}{S_b^2/\sigma_2^2}\sim F_{m,n}$
可取 $F$ 作为枢轴量。
当 $a, b$ 未知是，有 $(m−1)S12∼χm−12,(n−1)S22∼χn−12(m-1)S_1^2\sim \chi^2_{m-1},(n-1)S_2^2\sim \chi^2_{n-1}$ ，于是
$F=\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}\sim F_{m-1.n-1}$
可取 $F$ 作为枢轴量。

3.非正态分布的枢轴变量法

对于指数分布 $Exp(λ)，f(x,λ)=λe−λxI(0,∞)(x)\text{Exp}(\lambda)，f(x,\lambda)=\lambda e^{-\lambda x}I_{(0,\infty)(x)}$ ，由于 $Xˉ\bar X$ 是其UMVUE且 $2λnXˉ∼χ2n22\lambda n\bar X\sim \chi_{2n}^2$ ，所以可取 $T=2λnXˉT=2\lambda n\bar X$ 为枢轴量。

对于分布 $U(0,θ)U(0,\theta)$ ， $n+1nX(n)\frac{n+1}nX_{(n)}$ 是其UMVUE， $Y=X(n)θY=\frac{X_{(n)}}{\theta}$ 的概率密度为 $f_Y(y)=ny^{n-1}I_{(0,1)}(y)$ ，分布函数为 $FY(y)=ynI(0,1)(y)+I(1,∞)(y)F_Y(y)=y^nI_{(0,1)}(y)+I_{(1,\infty)}(y)$ 。取它的倒数 $Z = 1 / Y$ ，则
$\begin{aligned} for \quad z>1,F_Z(z)=&\mathbf P(1\le \frac{1}{Y_{(n)}}\le z)\\ =&\mathbf P(\frac1z\le Y_{(n)}\le1)\\ =&1-F_Y(\frac1z)\\ =&1-z^{-n}\\ f_Z(z)=&F'_Z(z)=nz^{-(n+1)}I_{(1,\infty)}(z) \end{aligned}$
现确定 $1≤d1≤d2≤∞1\le d_1\le d_2\le \infty$ ，使得
$\begin{aligned} &\mathbf P_\theta\left(d_1\le \frac\theta T\le d_2\right)\\ =&\mathbf P_\theta(d_1T\le \theta \le d_2T)\\ =&\int_{d_1}^{d_2}nz^{-n-1}dz\\ =&\frac1{d_1^n}-\frac1{d_2^n}=1-\alpha \end{aligned}$
取 $d1=1,d2=1αnd_1=1,d_2=\frac1 {\sqrt[n]{\alpha}}$ ，反解得到置信区间为 $[T,Tαn][T,\frac T{\sqrt[n]{\alpha}}]$ 。

按照大样本方法找未知参数的置信区间，有以下几个例子。

柯西分布 $C(θ)C(\theta)$ 的位置参数，密度函数为 $f(x,θ)=1π[1+(x−θ)2]f(x,\theta)=\frac1{\pi[1+(x-\theta)^2]}$ 。由于柯西分布没有均值，样本的中位数 $m_n$ 反映总体的中位数，所以取 $mn−θm_n-\theta$ 作为枢轴量。在大样本情形下，有
$\frac{2\sqrt n(m_u-\theta)}{\pi}\stackrel{\mathscr L}{\longrightarrow }N(0,1)$
对于两点分布 $b (1, p)$ 中抽取的样本 $,Xn)\boldsymbol X=(X_1,\cdots,X_n)$ ，取 $Sn=∑i=1nXiS_n=\sum_{i=1}^nX_i$ ，有 $Sn∼b(n,p)S_n\sim b(n,p)$ 。在大样本情形下，有
$\frac{S_n -np}{\sqrt{np(1-p)}}=\frac{\sqrt n(\bar X-p)}{\sqrt {p(1-p)}}\stackrel{\mathscr L}{\longrightarrow }N(0,1)\\ \mathbf P(|T|\le u_{\alpha/2})\approx1-\alpha$
要从枢轴量中解出统计量，记 $γ=uα/2,p^=Xˉ\gamma=u_{\alpha/2},\hat p=\bar X$ ，则
$∣n(p^−p)p(1−p)∣≤γ ⟺ (p^−p)2≤γ2p(1−p)n ⟺ p2(n+γ2)−p(2np^+γ2)+np^2≤0Δ=(2np^+γ2)2−4np^2(n+γ2)=γ2(γ2+4np^(1−p^))≥0 \begin{aligned} &\left|\frac{\sqrt n(\bar X-p)}{\sqrt{p(1-p)}}\right|\le u_{\alpha/2}\\ \iff&\left|\frac{\sqrt n(\hat p-p)}{\sqrt{p(1-p)}}\right|\le\gamma\\ \iff&(\hat p-p)^2\le\frac{\gamma^2p(1-p)}{n}\\ \iff&p^2(n+\gamma^2)-p(2n\hat p+\gamma^2)+n\hat p^2\le0 \end{aligned}\\ \Delta=(2n\hat p+\gamma^2)^2-4n\hat p^2(n+\gamma^2)=\gamma^2(\gamma^2+4n\hat p(1-\hat p))\ge0$
这就可以根据一元二次方程的解法解出两个正根。实际应用中，如果将分母的 $p$ 直接换成 $p^\hat p$ 则更为简洁，且依然有渐近正态性，即
$n(p^−p)p^(1−p^)⟶LN(0,1) \frac{\sqrt{n}(\hat p-p)}{\sqrt{\hat p(1-\hat p)}}\stackrel{\mathscr L}{\longrightarrow }N(0,1)$

对于泊松分布 $P(λ),P(Xi=k)=λkn!e−λP(\lambda),P(X_i=k)=\frac{\lambda^k}{n!}e^{-\lambda }$ ，记 $Sn=∑i=1nXi∼P(nλ)S_n=\sum_{i=1}^n X_i\sim P(n\lambda )$ ，当 $n$ 充分大时，有
$\frac{S_n-n\lambda}{\sqrt{n\lambda}}=\frac{\sqrt{n}(\bar X-\lambda)}{\sqrt \lambda }\stackrel{\mathscr L}{\longrightarrow }N(0,1)$
于是可以将其作为估计量，方法与两点分布类似。实际运用中，也可以采用与两点分布一样的简化方法，把分母中的 $λ\lambda$ 换成 $λ^=Xˉ\hat \lambda=\bar X$ ，直接有
$n(Xˉ−λ)λ^⟶LN(0,1) \frac{\sqrt n(\bar X-\lambda)}{\sqrt {\hat \lambda }}\stackrel{\mathscr L}{\longrightarrow }N(0,1)$