文章目录
前言
对于分类模型,一般有三种建模方法:
- 生成模型
- 判定模型
- 直接学习决策边界。(本文先不讲)
二者的区别
生成式模型:
- 举例:现在要判定一只羊是山羊还是绵羊,根据山羊的特征首先学习出一个山羊的模型A,然后根据绵羊的特征学习出一个绵羊的模型B,然后从这只羊中提取特征C,之后把C放到A、B里都跑一跑,看看概率,哪个大就是哪个。
判别式模型:
- 判别模型之所以称为“判别”模型,是因为其根据X“判别”Y;
- 要确定一个羊是山羊还是绵羊,用判别模型的方法是从历史数据中学习到模型,然后通过提取这只羊的特征来预测出这只羊是山羊的概率,是绵羊的概率。
总而言之:
- 判别式模型是根据一只羊的特征可以直接给出这只羊的概率(比如logistic regression,这概率大于0.5时则为正例,否则为反例),而生成式模型是要都试一试,最大的概率的那个就是最后结果~
维基百科上Generative案例:
假设有四个samples: