统计学习II.7 广义线性模型1 指数分布族

本文深入探讨了广义线性模型中的指数分布族,包括其定义、性质、MLE求解以及贝叶斯方法。通过伯努利分布和多项式分布举例,阐述了指数分布族在统计学习中的应用。
摘要由CSDN通过智能技术生成


这一部分介绍广义线性模型,这是一类监督学习方法,通常用来构造分类器等。考虑 { ( X i , Y i ) } i = 1 N \{(X_i,Y_i)\}_{i=1}^N { (Xi,Yi)}i=1N,广义线性模型通常假设 Y i Y_i Yi服从某种指数分布族。因此这一部分先介绍指数分布族,然后介绍基于不同指数分布族导出的广义线性模型的不同效果。


指数分布族的定义

p ( x ∣ θ ) p(x|\theta) p(xθ)表示某个密度函数,称它是指数分布族(exponential family)如果:
p ( x ∣ θ ) = h ( x ) exp ⁡ ( θ T ϕ ( x ) − A ( θ ) ) p(x|\theta) = h(x)\exp(\theta^T \phi(x)-A(\theta)) p(xθ)=h(x)exp(θTϕ(x)A(θ))

根据密度函数的归一性,
∫ p ( x ∣ θ ) d x = ∫ h ( x ) exp ⁡ ( θ T ϕ ( x ) − A ( θ ) ) d x = exp ⁡ ( − A ( θ ) ) ∫ h ( x ) exp ⁡ ( θ T ϕ ( x ) ) d x = 1 \int p(x|\theta)dx =\int h(x)\exp(\theta^T \phi(x)-A(\theta))dx \\ = \exp(-A(\theta))\int h(x)\exp(\theta^T \phi(x))dx =1 p(xθ)dx=h(x)exp(θTϕ(x)A(θ))dx=exp(A(θ))h(x)exp(θTϕ(x))dx=1

于是

A ( θ ) = log ⁡ Z ( θ ) , Z ( θ ) = ∫ h ( x ) exp ⁡ ( θ T ϕ ( x ) ) d x A(\theta)=\log Z(\theta), Z(\theta)=\int h(x)\exp(\theta^T\phi(x))dx A(θ)=logZ(θ),Z(θ)=h(x)exp(θTϕ(x))dx

其中 θ \theta θ被称为natural parameter, ϕ ( X ) \phi(X) ϕ(X)是这个指数族的充分统计量(基于Fisher-Neyman定理), Z ( θ ) Z(\theta) Z(θ)是partition function, A ( θ ) A(\theta) A(θ)是cumulant function,如果 ϕ ( X ) = X \phi(X)=X ϕ(X)=X,称这样的指数族为自然指数族(natural exponential family)。

指数分布的另一种形式为
p ( x ∣ θ ) = h ( x ) exp ⁡ ( η ( θ ) T ϕ ( x ) − A ( η ( θ ) ) ) p(x|\theta) = h(x)\exp(\eta(\theta)^T \phi(x)-A(\eta(\theta))) p(xθ)=h(x)exp(η(θ)Tϕ(x)A(η(θ)))如果 dim ⁡ ( θ ) < dim ⁡ ( η ( θ ) ) \dim(\theta)<\dim(\eta(\theta)) dim(θ)<dim(η(θ)),称之为curved exponential family,此时充分统计量的数目比参数多;如果 dim ⁡ ( θ ) = dim ⁡ ( η ( θ ) ) \dim(\theta)=\dim(\eta(\theta)) dim(θ)=dim(η(θ)),称之为canonical form;

指数分布族的例子

Bernoulli分布

p ( x ∣ μ ) = μ x ( 1 − μ ) 1 − x = exp ⁡ ( ϕ ( x ) T θ ) p(x|\mu)=\mu^x(1-\mu)^{1-x}=\exp(\phi(x)^T\theta) p(xμ)=μx(1μ)1x=exp(ϕ(x)Tθ)

其中
ϕ ( x ) = [ 1 x = 0 , 1 x = 1 ] T , θ = [ log ⁡ ( μ ) , log ⁡ ( 1 − μ ) ] T \phi(x)=[1_{x=0},1_{x=1}]^T,\theta=[\log(\mu),\log(1-\mu)]^T ϕ(x)=[1x=0,1x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值