生成式模型和判别式模型

WHElpokji

于 2019-07-25 21:45:04 发布

阅读量343

点赞数

文章标签：机器学习

机器学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

生成式模型

生成式模型(generative model)会对 $x$ 和 $y$ 的联合分布 $p (x, y)$ 进行建模,然后通过贝叶斯公式来求得 $p (y ∣ x)$ , 最后选取使得 $p (y ∣ x)$ 最大的 $y_i$ .
具体地, $y_{*}=arg \max_{y_i}p(y_i|x)=arg \max_{y_i}\frac{p(x|y_i)p(y_i)}{p(x)}=arg \max_{y_i}p(x|y_i)p(y_i)=arg \max_{y_i}p(x,y_i)$ .

相关算法:

判别式分析 •
朴素贝叶斯 •
K近邻(KNN) •
混合高斯模型 •
隐马尔科夫模型(HMM) •
贝叶斯网络 •
Sigmoid Belief Networks •
马尔科夫随机场(Markov Random Fields) •
深度信念网络(DBN)

判别式模型

判别式模型(discriminative model)则会直接对 $p (y ∣ x)$ 进行建模.

相关算法:

线性回归(Linear Regression) •
逻辑斯蒂回归(Logistic Regression) •
神经网络(NN)
支持向量机(SVM) •
高斯过程(Gaussian Process) •
条件随机场(CRF)
CART(Classification and Regression Tree)

二者优缺点

一般来说, 生成式模型都会对数据的分布做一定的假设, 比如朴素贝叶斯会假设在给定 $y$ 的情况下各个特征之间是条件独立的: $p(X|y)=\prod_{i=1}^{N}p(x_i|y)$ , GDA会假设 $p(X|y=c,\theta)=\mathcal{N}(\mu_c,\Sigma_c)$ . 当数据满足这些假设时, 生成式模型通常需要较少的数据就能取得不错的效果, 但是当这些假设不成立时, 判别式模型会得到更好的效果.
生成式模型最终得到的错误率会比判别式模型高, 但是其需要更少的训练样本就可以使错误率收敛[限于Genarative-Discriminative Pair, 详见[2]].
生成式模型更容易拟合, 比如在朴素贝叶斯中只需要计下数就可以, 而判别式模型通常都需要解决凸优化问题.
当添加新的类别时, 生成式模型不需要全部重新训练, 只需要计算新的类别 $y_new$ 和 $x$ 的联合分布 $p(y_new,x)$ 即可, 而判别式模型则需要全部重新训练.
生成式模型可以更好地利用无标签数据(比如DBN), 而判别式模型不可以.
生成式模型可以生成 $x$ , 因为判别式模型是对 $p (x, y)$ 进行建模, 这点在DBN的CD算法中中也有体现, 而判别式模型不可以生成 $x$ .
判别式模型可以对输入数据 $x$ 进行预处理, 使用 $\phi(x)$ 来代替 $x$ , 如下图所示, 而生成式模型不是很方便进行替换.

参考资料:
https://www.cnblogs.com/kemaswill/p/3427422.html

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

WHElpokji CSDN认证博客专家 CSDN认证企业博客

码龄8年

15: 原创

25万+: 周排名

38万+: 总排名

12万+: 访问

: 等级

1299: 积分

19: 粉丝

59: 获赞

16: 评论

207: 收藏

私信

关注

热门文章

最新评论

word 公式带章节的自动编号
这不是常识吗？: 您好，您的2部分(SEQ seq \c - SEQ Equation \* ARABIC \s 1)部分少打了个“\”，不然会报错
KL-divergence
人蔡就要多玩球: 这个主要用于交叉熵的计算，作用为计算信息传输时的代价，D(P||Q)和D(Q||P)通常不一样，具体以哪个为准还是看你准备用哪个。如果定下D(P||Q),可以理解为P是原始的信息，Q为经过传输后接收到的信息，即，Q为P经过修改后的信息，我们通过Q推断P时，就计算D(P||Q)，这就是Q中被修改过的部分。
Linux下载kaggle里的数据
RicardoSuzaku: 已成功，感谢博主
KL-divergence
WHElpokji: KL散度确实是不对称的, 但是具体以哪个为准会更好我也不知道...可能需要再多加了解
KL-divergence
cswenboli: 在计算的例子中，如果将P(i),Q(i)位置交换，就算出的结果就不一样了，请问那要以哪个为准呢？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。