狄利克雷分布公式_超详细推导:PRML中指数族分布的二阶偏导

3345326634ff6601f9da4637f97abada.png

纯干货向,数学公式推导爱好者可以浏览浏览,欢迎交流~

本文将按照Point->Reason->Example->Point的结构,推导PRML中指数族分布的一阶偏导以及二阶偏导与充分统计量的关系。

一、Point:指数族分布的形式以及偏导的形式

(1)指数族分布的形式

指数族分布指的不是某个具体的分布,而是一种抽象形式,可以具象化为高斯分布,伯努利分布,二项分布,Beta分布以及狄利克雷分布等。PRML书中给出的指数族分布形式为:

b418e24f5b4bdec2d9996335fbda3b95.png
指数族分布,等式(1)

其中随机变量

可以是标量/向量,可以为离散/连续。
被称为概率分布的自然参数(natural parameter),
指数族分布的一阶与二阶偏导即是关于参数
的偏导。
是随机变量
的某个函数。函数
表示概率分布的归一化系数:

a7b91499e5f83d779e6b0b3c8735c304.png
指数族分布的积分,等式(2)

请注意,这个性质非常重要,后续推导中都会用到这个等式。

(2)指数族分布的一阶偏导与二阶偏导的形式

这里直接给出结论:

664ccaede77eb9036c5cbbbea5881b10.png

这个结论表示:归一化系数

关于自然参数
的一阶导数以及二阶导数即是随机变量的函数
的期望和方差(相差符号)。
这是非常有用的,假如指数族分布是某个高斯分布,那么可以通过对求函数
关于
的导数得到其均值与方差两个参数,高斯分布的形式就解出来了。

二、Reason:指数族分布偏导形式的详细推导

(1)指数族分布的一阶偏导

这里是针对等式(2)的两边关于自然参数

求偏导,由于积分是关于随机变量
的积分而与
无关,直接根据乘法求导原理,有:

b94d9544227ae756b2d3b55d4d488fa0.png
等式(3)

接下来,根据等式(1)以及等式(2)的变换形式:

71c72a44b2996701d9543a2c224e6fff.png
等式(4)

将等式(1)以及等式(4)代入等式(3),可以得到:

efe379270d10207911513749d7163740.png

解释一下每一步的变换:

(2.1)偏导符号改写成

(2.2)根据数学期望的定义式

,将等式(1)给出的概率分布
视为随机变量
的分布,
为随机变量
的函数,可以发现(2.2)步就是用期望符号替换掉了积分;

(2.3)移项;

(2.4)将分数形式改写成复合函数求导的等价形式:

至此,推导出了一阶偏导的形式。

(2)指数族分布的二阶偏导

二阶偏导在PRML的书上是作为一道课后习题给出的,网上对这个偏导的推导资料比较少,因此笔者自己动手推导了一遍。

二阶偏导,就是在一阶偏导的等式(3)中再对自然参数

求一次偏导,同样地应用函数乘法求导的原理就好了(
这里合并了一下同类项,并再次根据期望的定义式把积分替换成了期望):

4ef6f51cf8288412869d9e508dc5dd5b.png
等式(5)

对等式(5)的两边同时乘以

得到:

f41b058a1be412a31c76fa2d00a46e07.png

解释一下每一步的变换:

(2.5)对于加和的第一项,使用了指数族分布的积分等于1的性质(即等式(2)),代入后积分项消失;

对于加和的第二项,则使用了一阶导数等于0的特点,有:

cb55f58a6c8c3f15ea43f1de8b4233a8.png

用等式右边替换掉左边。

(2.6)将等式(4)代入加和的第二项得到;

(2.7)移项。

利用前面推导得出的一阶偏导中数学期望和函数

的关系,有:

abde4d313dc4dcd9a3aade9518ba67d5.png

接下来,就容易证明二阶偏导的结论了:

90a8ff46fa280561b5671046bbe603b0.png

至此,推导证明结束。


三、Example:高斯分布的均值与方差

这个步骤在PRML中已经有了详细的讲解,可以跳过~

为了保证本文体系的完整性,再啰嗦一下高斯分布这个例子,来更好地理解指数族分布这个特点的应用~

(1)高斯分布的指数族表达

对于一元高斯分布,有:

2a750f08e0a0106e1f41dc9a62c4df7e.png
图是原书截的

把它和等式(1)给出的指数族分布形式一一对号入座,有:

45e561dc87bbe03e5c9cbf04dd7d9e51.png
图是原书截的+1

现在通过前面推导的公式来验证一下,偏导会是啥结果(这里只考虑

的系数
的情况):

85f8645e3a3aee52eb6d145e1421eac7.png

同样地可以得到:

5fa5a0ca99a19d24bb2aeea8a6b0887e.png

这里就得到了

的均值和方差,要得到
的均值和方差,对
求一阶和二阶偏导即可。

四、Point:回顾结论

本文通过给出指数族分布的定义,推导了指数族分布中的归一化系数

关于自然参数
的一阶导数和二阶导数,得到了如下非常有意思的结论:

664ccaede77eb9036c5cbbbea5881b10.png

并通过高斯分布的例子,说明了指数族分布这个特性的应用点。

最后,公式推导不容易啊。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值