数理统计复习笔记二——充分统计量

一、背景

统计量的引入是为了简化样本的繁杂,但所使用的统计量是否把样本中关于感兴趣问题的信息全部吸收进来了?这就引出充分统计量的概念。它是Fisher正式提出的,其思想源于他和Eddington关于估计标准差的争论。

二、定义

对于某分布族 F = { F θ ( x ) : θ ∈ Θ } \mathcal F=\{F_\theta(x):\theta\in\Theta\} F={Fθ(x):θΘ} ∀ F ∈ F \forall F\in\mathcal F FF,设 X 1 , ⋯   , X n X_1, \cdots, X_n X1,,Xn是来自 F F F的样本, T = T ( X 1 , ⋯   , X n ) T=T(X_1, \cdots, X_n) T=T(X1,,Xn)是一统计量,如在给定 T = t T=t T=t下,样本 ( X 1 , ⋯   , X n ) (X_1, \cdots, X_n) (X1,,Xn)的条件概率分布与总体分布 F F F或参数 θ \theta θ无关,则称统计量 T T T是此分布族 F \mathcal F F充分统计量,也称统计量 T T T是参数 θ \theta θ的充分统计量。

  • 对于连续型随机变量,其概率分布为概率密度函数;对于离散型随机变量,其概率分布为累积分布函数
  • 充分统计量 T T T可以是向量,但不一定与参数的维度相同
  • 如果统计量 T T T是参数 θ \theta θ的充分统计量,且 S ( t ) S(t) S(t)是单值可逆的,则 S ( T ) S(T) S(T)也是 θ \theta θ的充分统计量

三、因子分解定理

对于分布族 F = { F θ ( x ) : θ ∈ Θ } \mathcal F=\{F_\theta(x):\theta\in\Theta\} F={Fθ(x):θΘ},设 X 1 , ⋯   , X n X_1, \cdots, X_n X1,,Xn是一组IID样本, T T T是一统计量,则 T T T θ \theta θ的充分统计量的充要条件是:其样本分布 f θ ( x 1 , ⋯   , x n ) f_\theta(x_1, \cdots, x_n) fθ(x1,,xn)可做如下分解: f θ ( x 1 , ⋯   , x n ) = g θ ( T ( x 1 , ⋯   , x n ) ) ⋅ h ( x 1 , ⋯   , x n ) f_\theta(x_1, \cdots, x_n)=g_\theta(T(x_1, \cdots, x_n))\cdot h(x_1, \cdots, x_n) fθ(x1,,xn)=gθ(T(x1,,xn))h(x1,,xn)
其中, h ( x ) h(\bm x) h(x)不依赖于参数 θ \theta θ

证明:

给出离散情况下的证明:
此时 f θ ( x 1 , ⋯   , x n ) = P { X 1 = x 1 , ⋯   , X n = x n } f_\theta(x_1, \cdots, x_n)=P\{X_1=x_1, \cdots,X_n=x_n\} fθ(x1,,xn)=P{X1=x1,,Xn=xn},对于给定的 t t t,定义 A ( t ) = { ( x 1 , ⋯   , x n ) : T ( x 1 , ⋯   , x n ) = t } A(t)=\{(x_1, \cdots, x_n): T(x_1, \cdots, x_n)=t\} A(t)={(x1,,xn):T(x1,,xn)=t}

⋅ \cdot 充分性:对于给定当前样本值 x \bm x x,当 x ∉ A ( t ) \bm x\notin A(t) x/A(t)时, P { X = x ∣ T = t } = 0 P\{ \bm X=\bm x|T=t\}=0 P{X=xT=t}=0与参数 θ \theta θ无关;当 x ∈ A ( t ) \bm x\in A(t) xA(t)时,有 P { X = x ∣ T = t } = P { X = x , T = t } P θ { T = t } = P { X = x } P θ { T = t } = g θ ( t ) h ( x ) ∑ y ∈ A ( t ) g θ ( t ) h ( y ) = h ( x ) ∑ y ∈ A ( t ) h ( y ) P\{ \bm X=\bm x|T=t\}=\frac{P\{ \bm X=\bm x, T=t\}}{P_\theta\{T=t\}}=\frac{P\{ \bm X=\bm x\}}{P_\theta\{T=t\}}=\frac{g_\theta(t)h(x)}{\sum\limits_{\bm y\in A(t)}g_\theta(t)h(\bm y)}=\frac{h(x)}{\sum\limits_{\bm y\in A(t)}h(\bm y)} P{X=xT=t}=Pθ{T=t}P{X=x,T=t}=Pθ{T=t}P{X=x}=yA(t)gθ(t)h(y)gθ(t)h(x)=yA(t)h(y)h(x),与参数 θ \theta θ无关
⋅ \cdot 必要性:设 T T T是充分统计量,由定义可知 P { X = x ∣ T = t } P\{ \bm X=\bm x|T=t\} P{X=xT=t}与参数 θ \theta θ无关,则它只能是 x \bm x x的函数,我们记之为 h ( x ) h(\bm x) h(x),对于给定的 t t t x ∈ A ( t ) \bm x\in A(t) xA(t),我们有 P θ { X = x } = P { X = x ∣ T = t } P θ { T ( x ) = t } = g θ ( t ) h ( x ) P_\theta\{\bm X=\bm x\}=P\{ \bm X=\bm x|T=t\}P_\theta\{T(\bm x)=t\}=g_\theta(t)h(\bm x) Pθ{X=x}=P{X=xT=t}Pθ{T(x)=t}=gθ(t)h(x)

四、例子

  1. 均匀分布 U ( 0 , θ ) U(0,\theta) U(0,θ)的充分统计量: T = max ⁡ { X 1 , ⋯   , X n } = X ( n ) T=\max\{X_1,\cdots,X_n\}=X_{(n)} T=max{X1,,Xn}=X(n)
  2. 正态分布 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2)的充分统计量: T = ( X ‾ , ∑ i = 1 n ( X i − X ‾ ) 2 ) T=(\overline X, \sum_{i=1}^n(X_i-\overline X)^2) T=(X,i=1n(XiX)2)
  3. 伯努利分布 b ( 1 , p ) b(1, p) b(1,p)的充分统计量: T 1 = ( X 1 , ⋯   , X n ) T_1=(X_1, \cdots, X_n) T1=(X1,,Xn) T 2 = ( X 1 + X 2 , ⋯   , X n ) T_2=(X_1+X_2, \cdots, X_n) T2=(X1+X2,,Xn) ⋯ ⋯ ⋯ \cdots\cdots\cdots T n = X 1 + ⋯ + X n T_n=X_1+\cdots+X_n Tn=X1++Xn
  4. 柏松分布 P ( λ ) P(\lambda) P(λ)的充分统计量: T = ∑ i = 1 n X i T=\sum_{i=1}^nX_i T=i=1nXi
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值