"模式识别与机器学习"读书笔记——2.1 Binary Variables

从最简单的变量谈起——一位二进制变量(只有0/1两种值)。

典型例子翻硬币,假设人头朝上的概率为u,作为这个模型的参数,则其概率分布为:

2011071210384642.jpg

这个分布也称Bernoullo distribution,期望方差为:

2011071210400559.jpg

如果有一组观察数据D={x1,x2,...,xn},则这组观察数据出现的概率为:

2011071210433893.jpg

选择u的依据就是,让上面这个概率最大化,方法还是那个取对数,再求导令其等于0,得到p最大时:

2011071210450886.jpg

所以如果测试数据中人头出现了m次,则

2011071210461036.jpg

此外,当给定一个u时,我们还可以求出关于m的概率分布,就是求出人头出现0次、1次、2次……N次得概率分别是多少。
要点是需要normalize以下,保证归一性。

人头出现m次得概率为:

2011071210520491.jpg

其中

2011071210523238.jpg

2.1.1 The beta distribution

用前面那个方法会出现over=fitted问题,即如果三次银币都正面朝上,用上述方法判断,下次硬币一定也朝上,这不符合实际。

采用的办法时引入prior distribution,相当于人为的调整了。

这里引入的prior distribution是beta distribution:

2011071211462849.jpg

其中2011071211472823.jpg叫gamma function,是在上一章作业中出现的。

注意这个beta distribution的形式与那个m的分布式一样的,都是2011071211494479.jpg,这叫做共轭性(conjugacy),这样prior,posterior,liklihood的形式就都一样了,无论是计算还是设想实际意义都更简单了。

修正后的分布的求法就是把prior与上一节那个m分布式相乘,由于他们是共轭的,其实就是指数的叠加或图形的叠加,最终形式是:

2011071211541118.jpg

知道了u的概率后,如果想预测下一次翻硬币哪面朝上,方法为:

2011071213583848.jpg

用现有结论可以推出:

2011071213592818.jpg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值