PRML读书笔记——概率分布

本章主要介绍各种概率分布,包括伯努利分布、Beta分布、狄利克雷分布、高斯分布(重点)、指数族分布和非参数化方法估计的概率分布等。最后简单介绍了KL散度、计算学习理论和VC维的概念。

二元变量

(1) 伯努利分布

考虑一个二元变量 x{ 0,1} ,然后假设有一个抛硬币的场景与之对应,假设硬币正面向上( x=1 )的概率为 u ,则硬币正面向下( x=0 )的概率为 1u 则,得到伯努利分布

Bern(x|u)=ux(1u)1x

其中,

E[x]=u

var[x]=u(1u)

如果有多次观测数据 D={ x1,...,xn} ,则有:

p(D|u)=n=1Np(xn|u)=n=1Nuxn(1u)1xn

用最大似然的方法,可得:

uML=1Nn=1Nxn=mN

(2) 二项分布

给定数据集规模N的条件下, x=1 的观测出现的数量m的概率分布,被称为二项分布,可以写成:

Bin(m|N,u)=(Nm)um(1u)Nm

其中

(Nm)=N!(Nm)!m!

这个分布对应的均值和方差为:

E[m]m=0NmBin(m|N,u)=Nu

var[m]m=0N(mE[m])2Bin(m|N,u)=Nu(1u)

(3)Beta分布

上面两种分布,当数据样本少时,可能会存在较大误差,因为他们的期望都是概率均值,而观测少时可能期望与这个均值有偏差。

我们希望从贝叶斯的观点看待这个问题,需要引入关于u的先验概率分布 p(u) 。这里,我们希望后验概率保持与二项分布相似的形式,则要求引入的先验概率正比于 u 1u 的幂指数。Beta分布就是可选的先验分布之一。

Beta(u|a,b)=Γ(a+b)Γ(a)Γ(b)ua1(1u)b1

其中

Γ(x)0ux1eudu

这个分布对应的均值和方差为:

E[u]=aa+b

var[u]=ab(a+b)2(a+b+1)

这里 a b 是超参

假设硬币抛N次,有 m 次正面朝上, l=Nm 次反面朝上,则以Beta分布作为先验,对应的二项分布的参数的后验概率为:

p(u|m,l,a,b)=Γ(m+a+l+b)Γ(m+a)Γ(l+b)um+a1(1u)l+b1

显然,此时,后验和先验保持了相似的形式。

这里写图片描述

这里存在很有趣的现象,这个模型适用于顺序数据的概率预测。如果我们的目标是极可能好滴预测下一次实验的输出,则我们期望预测下面的概率:

p(x=1|D)=10p(x=1|u)p(u|D)du=10up(u|D)du=E[u|D]=m+am+a+l+b

现在,假设m和l是先验数据得到的结果,那么,每次新数据出现,如果 x=1 ,则 a 加一,反之 b+1 ,以此不断调整后验概率的情况,这样能逐步模拟最终的结果。

这里写图片描述

多项式变量

(1)多项式变量

现在考虑变量不止2种状态的情况,假设有K种可能的互斥状态。举个例子,如 x=(0,0,1,0,0,0)T ,这里 x 存在6种可能的状态。对应的分布为:

p(x|u)=k=1Kuxkk

则有:

E[x|u]=xp(x|u)x=(u1,...,uK)T=u

现在考虑N个独立观测数据的集合D,对应的似然函数为:

p(D|u)=n=Nk=1Kuxnkk=k=1Ku(nxnk)k=k=1Kumkk

其中

mk=nxnk

现在我们求解使模型证据最大的参数 u ,因为 kuk=1 ,则可以用拉格朗日乘子法构建函数:

L(u,λ)=k=1Kln uk+λ(k=1Kuk1)

求导计算得到:

uMLk=mkN

即N次观测中, xk=1 的观测所占的比例。

(2)多项式分布

我们考虑 m1,...,mK 在参数 u 和观测总数N的条件下的联合分布,则有:

Mult(m1,m2,...,mK|u,N)=(Nm1m2...mK)k=1Kumkk

其中

(Nm1m2...mK)=N!m1!m2!...mK!

这个分布就是多项式分布

(3)狄利克雷分布

现在考虑多项式分布的参数 { uk} 的一组先验分布,这里和Beta分布的初衷相似,我们还是希望这个先验是共轭的(后验和先验的形式类似),而观察多项式分布可以看到,多项式分布的共轭先验必然如下:

p(u|α)k=1Kuαk1k

根据这个,设计出归一化概率的狄利克雷分布:

Dir(u|α)=Γ(α0)Γ(α1)...Γ(αK)k=1Kuαk1k

其中

Γ(x)0ux1eudu

α0=k=1Kαk

用于多项式分布,则参数对应的后验概率分布为:

p(u|D
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值