面试相关 生成模型与判别模型的定义和优缺点

网易笔试题

生成模型和判别模型

生成模型: 由数据学习联合概率分布 P ( X , Y ) P(X,Y) P(X,Y),然后利用贝叶斯定理 P ( Y ∣ X ) = P ( X , Y ) / P ( X ) P(Y|X)=P(X,Y)/P(X) P(YX)=P(X,Y)/P(X),求出条件概率分布 P ( Y ∣ X ) P(Y|X) P(YX) 作为预测的模型。基本思想是首先建立样本的联合概率密度模型 P ( X , Y ) P(X,Y) P(X,Y),然后再得到后验概率 P ( Y ∣ X ) P(Y|X) P(YX),再利用它进行分类。这个过程中还得先求出 P ( X ) P(X) P(X) P ( X ) P(X) P(X) 是训练数据的概率分布。当数据样本非常多的时候,得到的 P ( X ) P(X) P(X) 才能很好的描述数据真正的分布。典型的生成模型有朴素贝叶斯法和隐马尔可夫模型。

判别模型:由数据直接学习条件概率(后验概率)分布 P ( Y ∣ X ) P(Y|X) P(YX) 作为预测的模型。判别方法关心的是对给定的输入 X X X ,应该预测什么样的输出 Y Y Y。 不考虑样本的产生模型,直接研究预测模型。典型的判别模型包括 k k k 近邻法、感知机、决策树、逻辑斯蒂回归模型、最大熵模型、支持向量机、提升方法和条件随机场等。

生成模型优点:

  • 生成模型可以还原出联合概率分布 P ( X , Y ) P(X,Y) P(X,Y)
  • 生成模型收敛速度比较快,即当样本数量较多时,生成模型能更快地收敛于真实模型;
  • 生成模型能够应付存在隐变量的情况,比如混合高斯模型就是含有隐变量的生成方法。

生成模型缺点:

  • 需要更多的样本和更多计算;
  • 实践中多数情况下判别模型效果更好。

判别模型优点:

  • 与生成模型缺点对应,首先是节省计算资源,另外,需要的样本数量也少于生成模型;

  • 判别模型直接学习的是条件概率 P ( Y ∣ X ) P(Y|X) P(YX),直接面对预测,往往学习的准确率更高;

  • 由于直接学习 P ( Y ∣ X ) P(Y|X) P(YX),可以对数据进行各种程度上的抽象、定义特征并使用特征,因此可以简化学习问题。

判别模型缺点:

  • 没有生成模型的优点。

参考《统计学习方法》

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值