数理统计复习笔记二——充分统计量

最新推荐文章于 2024-10-28 23:01:20 发布

原创最新推荐文章于 2024-10-28 23:01:20 发布 · 8.8k 阅读

49 ·

CC 4.0 BY-SA版权

概率论与数理统计专栏收录该内容

23 篇文章

订阅专栏

本文探讨了充分统计量的定义，介绍了因子分解定理，并通过均匀分布、正态分布、伯努利分布和柏松分布的实例展示其应用。理解充分统计量有助于优化参数估计，尤其是在统计推断中。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、背景

统计量的引入是为了简化样本的繁杂，但所使用的统计量是否把样本中关于感兴趣问题的信息全部吸收进来了？这就引出充分统计量的概念。它是Fisher正式提出的，其思想源于他和Eddington关于估计标准差的争论。

二、定义

对于某分布族 $F={Fθ(x):θ∈Θ}\mathcal F=\{F_\theta(x):\theta\in\Theta\}$ ， $∀F∈F\forall F\in\mathcal F$ ，设 $,XnX_1, \cdots, X_n$ 是来自 $F$ 的样本， $,Xn)T=T(X_1, \cdots, X_n)$ 是一统计量，如在给定 $T = t$ 下，样本 $,Xn)(X_1, \cdots, X_n)$ 的条件概率分布与总体分布 $F$ 或参数 $θ\theta$ 无关，则称统计量 $T$ 是此分布族 $F\mathcal F$ 的充分统计量，也称统计量 $T$ 是参数 $θ\theta$ 的充分统计量。

对于连续型随机变量，其概率分布为概率密度函数；对于离散型随机变量，其概率分布为累积分布函数
充分统计量 $T$ 可以是向量，但不一定与参数的维度相同
如果统计量 $T$ 是参数 $θ\theta$ 的充分统计量，且 $S (t)$ 是单值可逆的，则 $S (T)$ 也是 $θ\theta$ 的充分统计量

三、因子分解定理

对于分布族 $F={Fθ(x):θ∈Θ}\mathcal F=\{F_\theta(x):\theta\in\Theta\}$ ，设 $,XnX_1, \cdots, X_n$ 是一组IID样本， $T$ 是一统计量，则 $T$ 的 $θ\theta$ 的充分统计量的充要条件是：其样本分布 $,xn)f_\theta(x_1, \cdots, x_n)$ 可做如下分解： $,xn)f_\theta(x_1, \cdots, x_n)=g_\theta(T(x_1, \cdots, x_n))\cdot h(x_1, \cdots, x_n)$
其中， $h(x)h(\bm x)$ 不依赖于参数 $θ\theta$

证明：

给出离散情况下的证明：
此时 $,Xn=xn}f_\theta(x_1, \cdots, x_n)=P\{X_1=x_1, \cdots,X_n=x_n\}$ ，对于给定的 $t$ ，定义 $,xn)=t}A(t)=\{(x_1, \cdots, x_n): T(x_1, \cdots, x_n)=t\}$

$⋅\cdot$ 充分性：对于给定当前样本值 $x\bm x$ ，当 $x∉A(t)\bm x\notin A(t)$ 时， $P{X=x∣T=t}=0P\{ \bm X=\bm x|T=t\}=0$ 与参数 $θ\theta$ 无关；当 $x∈A(t)\bm x\in A(t)$ 时，有 $P{X=x∣T=t}=P{X=x,T=t}Pθ{T=t}=P{X=x}Pθ{T=t}=gθ(t)h(x)∑y∈A(t)gθ(t)h(y)=h(x)∑y∈A(t)h(y)P\{ \bm X=\bm x|T=t\}=\frac{P\{ \bm X=\bm x, T=t\}}{P_\theta\{T=t\}}=\frac{P\{ \bm X=\bm x\}}{P_\theta\{T=t\}}=\frac{g_\theta(t)h(x)}{\sum\limits_{\bm y\in A(t)}g_\theta(t)h(\bm y)}=\frac{h(x)}{\sum\limits_{\bm y\in A(t)}h(\bm y)}$ ，与参数 $θ\theta$ 无关
$⋅\cdot$ 必要性：设 $T$ 是充分统计量，由定义可知 $P{X=x∣T=t}P\{ \bm X=\bm x|T=t\}$ 与参数 $θ\theta$ 无关，则它只能是 $x\bm x$ 的函数，我们记之为 $h(x)h(\bm x)$ ，对于给定的 $t$ 和 $x∈A(t)\bm x\in A(t)$ ，我们有 $Pθ{X=x}=P{X=x∣T=t}Pθ{T(x)=t}=gθ(t)h(x)P_\theta\{\bm X=\bm x\}=P\{ \bm X=\bm x|T=t\}P_\theta\{T(\bm x)=t\}=g_\theta(t)h(\bm x)$

四、例子

均匀分布 $U(0,θ)U(0,\theta)$ 的充分统计量： $,Xn}=X(n)T=\max\{X_1,\cdots,X_n\}=X_{(n)}$
正态分布 $N(μ,σ2)N(\mu, \sigma^2)$ 的充分统计量： $T=(X‾,∑i=1n(Xi−X‾)2)T=(\overline X, \sum_{i=1}^n(X_i-\overline X)^2)$
伯努利分布 $b (1, p)$ 的充分统计量： $,Xn)T_1=(X_1, \cdots, X_n)$ $,Xn)T_2=(X_1+X_2, \cdots, X_n)$ $⋯⋯⋯\cdots\cdots\cdots$ $Tn=X1+⋯+XnT_n=X_1+\cdots+X_n$
柏松分布 $P(λ)P(\lambda)$ 的充分统计量： $T=∑i=1nXiT=\sum_{i=1}^nX_i$