生成模型与判别模型

决策函数Y=f(X)和条件概率分布P(Y|X)

监督学习,以分类器为例,实际学习的是决策函数:输入X,计算Y。

  • 决策函数 Y = f ( X ) Y=f(X) Y=f(X)时,将Y与一个阈值比较,判断X的类别,例如二分类,Y大于阈值,属于类别0,Y小于阈值,属于类别1.
  • 条件概率分布 P ( Y ∣ X ) P(Y|X) P(YX),输入X,比较输出概率最大的作为X对应的类别,例如二分类: P ( Y = 0 ∣ X ) > P ( Y = 1 ∣ X ) P(Y=0|X)>P(Y=1|X) P(Y=0X)>P(Y=1X),则属于类别0.

上述两个模型都可以计算X属于的类别,实际上条件概率分布 P ( Y ∣ X ) P(Y|X) P(YX)预测也隐含这决策函数 Y = f ( X ) Y=f(X) Y=f(X)的形式,而决策函数 Y = f ( X ) Y=f(X) Y=f(X)也隐含着条件概率分布。

  • 例如二分类,我们求得了 P ( Y = 0 ∣ X ) P(Y=0|X) P(Y=0X) P ( Y = 1 ∣ X ) P(Y=1|X) P(Y=1X),判别函数Y可以表示为 P ( Y = 0 ∣ X ) P ( Y = 1 ∣ X ) \frac{P(Y=0|X)}{P(Y=1|X)} P(Y=1X)P(Y=0X),如果Y>1或者某个阈值,X就是类别0
  • 一般决策函数 Y = f ( X ) Y=f(X) Y=f(X)是通过算法拟合模型的预测和训练数据的误差,这实际也在隐含的输出极大似然假设,也就是说学习器的任务在所有假设模型有相等的先验概率条件下,输出极大似然假设

所以,可以这样理解,分类器的设计是为了学习给定数据下的概率模型 P ( Y ∣ X ) P(Y|X) P(YX),但概率模型比较难以估计,我们通过一个决策函数,根据数据和目标问题求出判别函数,就不需要估计概率模型了。

生成方法和判别方法

监督学习方法又分生成方法(Generative approach)和判别方法(Discriminative approach),所学到的模型分别称为生成模型(Generative Model)和判别模型(Discriminative Model)。
判别方法:由数据直接学习决策函数Y=f(X)或者条件概率分布P(Y|X)作为预测的模型,即判别模型。基本思想是有限样本条件下建立判别函数,不考虑样本的产生模型,直接研究预测模型。典型的判别模型包括k近邻,感知级,决策树,支持向量机等。
生成方法:由数据学习联合概率密度分布P(X,Y),然后求出条件概率分布P(Y|X)作为预测的模型,即生成模型:P(Y|X)= P(X,Y)/ P(X)。基本思想是首先建立样本的联合概率概率密度模型P(X,Y),然后再得到后验概率P(Y|X),再利用它进行分类,就像上面说的那样。注意了哦,这里是先求出P(X,Y)才得到P(Y|X)的,然后这个过程还得先求出P(X)。P(X)就是你的训练数据的概率分布。
这样的方法之所以称为生成方法,是因为模型表示了给定输入X产生输出Y的生成关系。用于随机生成的观察值建模,特别是在给定某些隐藏参数情况下。典型的生成模型有:朴素贝叶斯和隐马尔科夫模型等。

两个例子

例如我们有以下(x,y)形式的数据:(1,0), (1,0), (2,0), (2, 1)

那么p(x,y)是:

y=0y=1
x=11/20
x=21/41/4

而p(y|x) 是:

y=0y=1
x=110
x=21/21/2

我们为了将一个样本x分类到一个类y,最自然的做法就是条件概率分布 p ( y ∣ x ) p(y|x) p(yx),这就是为什么我们对其直接求 p ( y ∣ x ) p(y|x) p(yx)方法叫做判别算法。而生成算法求 p ( x , y ) p(x,y) p(x,y),而 p ( x , y ) p(x,y) p(x,y)可以通过贝叶斯方法转化为 p ( y ∣ x ) p(y|x) p(yx),然后再用其分类。但是 p ( x , y ) p(x,y) p(x,y)还有其他作用,例如,你可以用它去生成(x,y)对。

再举一个更形象的例子,老师给学渣和学霸做考前辅导,解题方式有两种:

  • 第一种,这道题涉及的知识点balabalabala,根据balabalabala…
  • 第二种,根据经验,看懂不会做的选B,看不懂的选D

考试时,学霸根据balabala全做完了,学渣根据第二种方式也做完了,结果一看,学霸和小明都考了98分。可以理解,学霸用的生成方法解题,找到解题所需的理论解题,小明用判别的方式解题,根据题的差别(能不能读懂题)解题。

特别感谢大佬12年的博客,让我理解了很多 生成模型与判别模型

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值