指数分布族

从标题上看,是“指数分布族(exponential family)”,不是“指数分布(exponential distribution)”,这是两个不同的概念,不要弄混了。指数分布族在上世纪30年代中期被提出,在概率论和统计学中,它是一些有着特殊形式的概率分布的集合,包括许多常用的分布,如正态分布、指数分布、伯努利分布、泊松分布、gamma分布、beta分布等等。指数分布族为很多重要而常用的概率分布提供了统一框架,这种一般性有助于表达的方便和从更大的宏观尺度上理解这些分布。

下面我们用一个重要分布的例子来说明下指数分布族。假设有一个正态分布,均值为0,服从 XN(0,σ2) ,则其概率密度函数PDF为:

f(x|σ)=1σ2πex22σ2

这个概率密度函数由一个参数 σ 来定义。我们可以把该式子作如下变形:

f(x|σ)=12πelogσex22σ2=12πex22σ2logσ=12πe12σ2x2logσ

令: h(x)=12π η(σ)=12σ2 T(x)=x2 A(σ)=logσ ;则上式可以用如下的形式表达:

f(x|σ)=h(x)exp(η(σ)T(x)A(σ))

我们把参数一般化为 θ ,则上式为:

f(x|θ)=h(x)exp(η(θ)T(x)A(θ))

这就是指数分布族的概率密度函数PDF或概率质量函数PMF的通用表达式框架。

分布函数框架中的 h(x) , η(θ) , T(x) A(θ) 并不是任意定义的,每一部分都有其特殊的意义。
θ 自然参数(natural parameter),通常是一个实数;
h(x) 底层观测值(underlying measure)
T(x) 充分统计量(sufficient statistic)
A(θ) 被称为对数规则化(log normalizer)
为什么被称为对数规则化,和对数有什么关系?我们把上式作以下变形:

f(x|θ)=h(x)exp(η(θ)T(x))exp(A(θ))

两边同乘以 exp(A(θ)) ,得到:

exp(A(θ))f(x|θ)=h(x)exp(η(θ)T(x))

两边同时积分,得到:

exp(A(θ))f(x|θ)dx=h(x)exp(η(θ)T(x))dx

exp(A(θ))f(x|θ)dx=h(x)exp(η(θ)T(x))dx

根据概率密度函数PDF的定义, f(x|θ)dx=1 ,因此整理上式得到:
exp(A(θ))=h(x)exp(η(θ)T(x))dx

则:
A(θ)=lnh(x)exp(η(θ)T(x))dx

我们再看看泊松分布的例子,根据泊松分布的概念,其概率质量函数PMF为:
f(x|λ)=eλλxx!

改写上式,我们可以得到:
f(x|λ)=eλλxx!=1x!eλelnλx=1x!exlnλλ

θ=λ h(x)=1x! η(θ)=lnλ T(x)=x A(θ)=λ ,则泊松分布也可以表示成:
f(x|θ)=h(x)exp(η(θ)T(x)A(θ))

因此,泊松分布也属于指数分布族。

  • 24
    点赞
  • 70
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值