判别模型和生成模型总结

最新推荐文章于 2023-04-28 11:25:07 发布

知了不知蝉鸣惊

最新推荐文章于 2023-04-28 11:25:07 发布

阅读量510

点赞数

分类专栏：概率图模型文章标签：生成模型判别模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/promisejia/article/details/88289886

版权

概率图模型专栏收录该内容

2 篇文章 0 订阅

订阅专栏

区别

判别模型：在有限样本的条件下建立判别函数，也就是最优分类面，实现分类（估计条件概率分布P（y|x））。在机器学习中，类似感知机等算法都是使用 $\sum w x_i $ 直接近似计算P（y|x），训练过程是反复根据历史数据更新w。

生成模型：建立样本的联合概率，再利用模型进行推理预测，要求样本尽可能大（估计联合概率分布P（x，y））。

例如，在垃圾垃圾邮件分类时，假设每个文档 d 由 k 个单词组成，记为 $d = [w_1,w_2,w_i, ..., w_k]$ 类别 c $\in$ {1, 0} 在朴素贝叶斯算法进行我们的目标是求 P（c|d），这个概率是通过历史数据建立联合概率分布P(d, c)得到的，只不过 P(d, c)不能直接得到，做一定的转化得到。对于一篇邮件d，其类别是 $c_i$ 的概率是：
$c_i |d) = \frac{P(w_1,w_2,...,w_k|c_i)* P(c_i)}{P(d)}$
$\approx {\prod_{j=1}^{k} P(w_j|c_i)* P(c_i)}$

注：约等于号使用了条件独立假设。

常见模型

判别模型：最大熵模型（ME），条件随机场（CRF），最大熵马尔可夫（MEMM），SVM
生成模型：朴素贝叶斯（NB），隐马尔可夫模型（HMM），LDA主题模型，高斯混合模型

优缺点：

生成模型：

优点：面向整体数据，可还原出联合概率分布，反应不同数据的联系；可以通过增量学习(样本容量增加时，快速收敛)得到；当含有隐变量时，仍可用生成学习方法，此时不能用判别方法。
缺点：分类性能不高，识别精度不高；要产生联合概率，资源使用过大

判别模型：

优点：简单，面向分类边界训练，可以清晰地分类出类别之间的差异性。
缺点：不能反应数据本身的特性，变量间的的关系不可视。

在分类问题中，在样本较小的情况下，容易产生过拟合，而考虑先验可以减少过拟合，所以生成模型的效果较好；当样本增大时，判别模型会渐渐优于生成模型，因为判别模型本身的直接目标就是判别类与类之间的差别。

例子

数据样本：(1,0), (1,0), (2,0), (2, 1)

联合分布P（x，y）：P(1,0) = 1/2; P(2,0) = 1/4; P(2,1) = 1/4
条件分布P（y|x）： P(0 | 1 ) = 1 ; P(1 | 1 ) =0 ; P(0 | 2 ) =1/2 ; P(1 | 2 ) =1/2 ;

知了不知蝉鸣惊

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
判别模型和生成模型总结

区别判别模型：在有限样本的条件下建立判别函数，也就是最优分类面，实现分类（估计条件概率分布P（y|x））。判别模型：建立样本的联合概率，再利用模型进行推理预测，要求样本尽可能大（估计联合概率分布P（x，y））。常见模型判别模型：最大熵模型（ME），条件随机场（CRF），最大熵马尔可夫（MEMM），SVM生成模型：朴素贝叶斯（NB），隐马尔可夫模型（HMM），LDA主题模型，高斯混合模型...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。