生成模型 VS 判别模型（含义、区别、对应经典算法）

最新推荐文章于 2025-07-16 22:08:38 发布

CAM-TAY

最新推荐文章于 2025-07-16 22:08:38 发布

阅读量7.6w

点赞数 67

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习生成模型判别模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010358304/article/details/79748153

机器学习专栏收录该内容

8 篇文章

订阅专栏

本文探讨了生成模型与判别模型的区别与联系，详细介绍了包括朴素贝叶斯、混合高斯模型、隐马尔可夫模型在内的生成模型，以及感知机、k近邻法、决策树等判别模型，并讨论了它们的应用场景与优缺点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

从概率分布的角度考虑，对于一堆样本数据，每个均有特征Xi对应分类标记yi。

生成模型：学习得到联合概率分布P(x,y)，即特征x和标记y共同出现的概率，然后求条件概率分布。能够学习到数据生成的机制。

判别模型：学习得到条件概率分布P(y|x)，即在特征x出现的情况下标记y出现的概率。

数据要求：生成模型需要的数据量比较大，能够较好地估计概率密度；而判别模型对数据样本量的要求没有那么多。

两者的优缺点如下图，摘自知乎

生成模型：以统计学和Bayes作为理论基础

1、朴素贝叶斯：

通过学习先验概率分布和条件概率分布，得到联合概率分布，然后对应分类时的后验概率为：

使用极大似然估计（使用样本中的数据分布来拟合数据的实际分布概率）得到先验概率。

2、混合高斯模型：

3、隐马尔可夫模型 (HMM)

由隐藏的马尔可夫链随机生成观测序列，是生成模型。HMM是关于时序的概率模型，描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列，再由各个状态生成一个观测而产生观测随机序列的过程。包含三要素：初始状态概率向量pie，状态转移概率矩阵A，观测概率矩阵B。

判别模型

1、感知机 (线性分类模型)

输入空间为，输出空间为，使用的映射函数为，其中sign为符号函数 (输入大于等于1时输出为1；否则为0)。使用的损失函数为误分类点到超平面的总距离，即：

其中M为所有误分类点的集合，||w||可以不考虑。可以使用随机梯度下降得到最后的分类超平面。

2、k近邻法

基于已知样本，对未知样本进行预测时，找到对应的K个最近邻，通过多数表决进行预测。没有显式的学习过程。

3、决策树

决策树在每个单元定义一个类的概率分布，形成一个条件概率分布。决策树中递归地选择最优特征，所谓最优特征即分类效果最好的特征，算法中使用信息增益 (information gain)来衡量，对应公式为：

其中D为训练集，A为待测试的特征，H(D)为熵 (经验熵)，H(D|A)为条件熵，两者的计算为

但是以信息增益为划分，存在偏向于选择取值较多的特征，因此使用信息增益比来校正，

其中n为特征A的取值个数。

4、逻辑斯蒂回归模型

使用条件概率分布表示，

可以使用极大似然估计法估计模型参数，对优化目标使用梯度下降法或者拟牛顿法。

5、最大熵模型

原理：概率模型中，熵最大的模型是最好的模型，可以使用拉格朗日函数求解对偶问题解决。

6、支持向量机 (SVM)

SVM分为线性可分支持向量机 (硬间隔最大化)、线性支持向量机 (软间隔最大化)、非线性支持向量机 (核函数)三种。

目的是最大化间隔，这是和感知机最大的区别。

7、boosting方法 (AdaBoost等)

通过改变训练样本的权重，训练多个分类器，将分类器进行线性组合，提升分类性能。AdaBoost采用加权多数表决的方法。

8、条件随机场 (conditional random field, CRF)

给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型，其特点是假设输出随机变量构成马尔可夫随机场。可应用于标注问题。

9、CNN

训练过程中，每一个中间层都有其功能，但其具体的功能无法知道。

博客等级

码龄12年

39
原创

218
点赞

1126
收藏

59
粉丝

关注

私信

热门文章

分类专栏

Quantities 1篇
macos 3篇
数据库 1篇
matlab 1篇
python 3篇
R语言 4篇
java 4篇
算法 5篇
机器学习 8篇
深度学习 1篇
统计学习 5篇
前端开发 1篇
前端学习 3篇
latex 2篇

展开全部收起

上一篇：: 图论算法总结

下一篇：: Java 8特性 (接口、Lambda等)

最新评论

python matplotlib 多个子图、堆积柱状图、频次/频率直方图绘画
t__小白: group=df[df['是否热门']=='N']['评论内容'].apply(lambda x: len(str(x))).reset_index() group_rm=df[df['是否热门']=='Y']['评论内容'].apply(lambda x: len(str(x))).reset_index() print (group,group_rm) x=[group_rm["评论内容"],group["评论内容"]] colors=["#8dd3c7", "#bebada"] labels = [ "热门评论","普通评论"] bins = range(0, 150, 5) #x轴刻度 #density是否将频数转为频率 plt.hist(x,color=colors,bins=bins,label=labels,stacked=True,density=True,weights=counts)[code=python] [/code]
python matplotlib 多个子图、堆积柱状图、频次/频率直方图绘画
t__小白: 如果有两组数据x1,x2要画频率分布直方图，每组数据在自己组的频率分布，density=true画出的是数据在整体的密度分布。请问这时weight如何赋值呢？[code=python] [/code]
python matplotlib 画图刻度、图例等字体、字体大小、刻度密度、线条样式设置
230万光年的思念: 子图的图例大小如何设置？
python matplotlib 画图刻度、图例等字体、字体大小、刻度密度、线条样式设置
weixin_45977006: 太有用了，正在困惑只有plt的怎么画
python matplotlib 画图刻度、图例等字体、字体大小、刻度密度、线条样式设置
萝卜丝皮尔: 如果只有plt没有ax的话，可以使用ax=plt.gca()获取当前坐标轴，再进行设置刻度值字体的操作。谢谢分享！

最新文章

目录

展开全部

收起

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。