生成模型和判别模型

最新推荐文章于 2024-02-23 10:01:03 发布

weixin_33812433

最新推荐文章于 2024-02-23 10:01:03 发布

阅读量76

点赞数

原文链接：http://www.cnblogs.com/simon6666/p/11010099.html

版权

咱们先不整那些难懂的数学公式，举两个例子

假设某手机有三个特征，我们的任务是预测某消费者是会购买还是不会购买该手机。
所以判别模型是根据已经知道的一些先验知识，从购买和不够买这两种可能中挑选一个。

手写数字识别: 给出一张图，里面有手写体数字一个，需要机器识别数字是几，那么决策有0～9 共10种可能。计算机在识别图片的时候，也是一小块一小块做卷积提取特征，那么为了方便说明，这里我已经手动提取出了3个特征并还原成人可以看懂的样子，如下。

无论是哪个例子，都是通过已经获得的一些信息辅助判断，最后给出一个决策。这也就是那些充满公式的文章所说的条件概率的原因。
总结来说，判别模型是用来预测在 y 事件已经发生的条件下，x事件发生的概率。

具体到以上的例子，就是特征一出现的条件下，数字是4的概率。或者说已经知道手机充电慢的情况下，购买手机的概率。

条件概率	联合概率
判别模型	生成模型

说完了条件概率，接下来就是联合概率。判别模型学习的是条件概率，而生成模型学习的则是联合概率。

为了更好的对比区别，我们还是用上文的例子：

这里我们要换一个任务，以便理解生成模型。我们的任务是做市场调查，并且完成如下表格的填写。

所以这次我们是要把眼光放大到整个市场。我们需要得到手机运行流畅和被购买了同时发生的联合概率，当然这样的联合还有很多，比如手机5.5寸没有被购买，手机充电慢被购买等等。

同理，我们在这里需要得到特征一出现并且数字分别是0到9的概率，以及特征二出现并且数字分别是0到9的概率。

如果这些手写数字全部源于一个人只手，我们统计出来的特征，甚至可以用于生成这个人的笔迹，因为这个人写出来的哪些字有哪些特征，概率是多少，我们都知道。

判别模型 是在你生父身高超过180的已知条件下，预测你身高会不会超过180。如果你生父比180高，那么你比180高的概率会增加。但是全世界人身高的概率分布暂时并没有改变。
（为了科学的严谨，这里爸爸已经改成了生父而非父亲）

生成模型 则是随机赐予你一个成年后的最高身高。身高超过180的概率是多少，这个概率只能依照全世界所有成人的身高的频率分布来决定。

转载于:https://www.cnblogs.com/simon6666/p/11010099.html

关注