生成模型

数理统计基本概念

 先解释一些基本概念:举例说明,如果你在山洞,觉得山洞中有熊出现的事件为Y,然后听到山洞中传出来一阵熊吼的事件为X。那么一开始你觉得山洞中有熊的事件的概率为P{(Y)},听到熊吼之后的认为山洞中有熊的概率为P{(Y|X)}。很明显P{(Y|X)}{>}P{(Y)}。这里P{(Y)}就是所谓的先验概率;P{(Y|X)}就是后验概率。

  • 先验概率:P{(Y)}为先验概率,是根据以往数据的分析或者经验的到的概率;
  • 后验概率:P{(Y|X)}为后验概率,是根据本次实验的信息从而重新修正的概率。
  • 条件概率:设AB是两个事件,且P{(A)}>0,称P{(B|A)}=\tfrac{P(AB)}{P(A)},为A事件发生的情况下B事件发生的条件概率
  • 全概率公式:设实验E的样本空间为SB_{1},B_{2},B_{3},...,B_{n}是对S的一个划分,且P(B_{i})>0(i = 1,2,...,n),则P(A)=P(AB_{1})+P(AB_{2})+...+P(AB_{n});再用条件概率展开,及就是全概率公式:P(A)=P(A|B_{1})P(B_{1})+P(A|B_{2})P(B_{2})+...+P(A|B_{n})P(B_{n})
  • 贝叶斯公式:设实验E的样本空间为SB_{1},B_{2},B_{3},...,B_{n}是对S的一个划分,且P(A),P(B_{i})>0(i = 1,2,...,n),则P(B_{i}|A)=\tfrac{P(A|B_{i})P(B_{i})}{\sum_{j=1}^{n}P(A|B_{j})P(B_{j})},这个公式就是贝叶斯公式。这个公式可以由条件概率公式推导出。这里给大家推导哈,方便理解。P(B_{i}|A)=\tfrac{P(AB_{i})}{P(A)},这个公式是条件概率来的。然后在将P(AB_{i})P(A)用条件概率和全概率公式展开就有,P(AB_{i})=P(A|B_{i})P(B_{i});P(A)=P(A|B_{1})P(B_{1})+P(A|B_{2})P(B_{2})+...+P(A|B_{n})P(B_{n})。这样贝叶斯公式就新鲜出炉了。

生成模型

上述解释了概率论与数理统计的一些基本概念,下来就阐述生成模型。生成模型判别模型的区别在于生成模型会对来自各个种类的样本分布进行估计。在获得样本分布后,计算出新样本属于各类的后验概率,进而给出样本最可能的属类。以二分类为例子。假设Y_{1}Y_{2}是二分类的类标,P(Y_{1})P(Y_{2})是这两个类的先验概率,即就有P{(Y_{1})}+P{(Y_{2})}=1。进一步假设类概率密度函数P(X|Y_{1})P(X|Y_{2})也已经知道(可以通过有标记数据计算出来),通常情况下,类的先验概率以及类条件概率并不能直接得到,必须通过给定的训练数据用统计学方法估计得到,这样就可以用贝叶斯公式计算后验概率P(B_{i}|A)。机器学习无非就是给你一大堆的数据,然你判别这个是属于那个类别,放在贝叶斯公式里边就是求这个P(B_{i}|A)。A为你给定的一系列数据。然后判别B是那个类别。

直观上,如果给点给样本属于某个类别的后验概率大于其他类别,那么就有理由相信该样本的类别就是前者,这种直观上的理解与贝叶斯最错误准则不谋而合。最小错误贝叶斯决策规则可以叙述为:

P(X|Y_{1})>P(X|Y_{2})那么X就属于Y_{1}类别;

P(X|Y_{1})<P(X|Y_{2})那么X就属于Y_{2}类别;

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值