【上篇博客用 “人话” 解释了机器学习中的监督学习、无监督学习、半监督学习、自监督学习这几个概念,那这篇博客来解释一下生成方法、判别方法、生成模型、判别模型这几个名词吧~~~】
监督学习方法可以分为两类,分别是生成方法(generative approach)和判别方法(discriminative approach),那么所学到的模型分别称为生成模型(generative model)和判别模型(discriminative model)。
生成方法:从数据集中首先学习联合概率分布P(X,Y),然后再根据已得到的联合概率分布P(X,Y)进而得到条件概率分布P(Y|X),最终根据条件概率分布P(Y|X)进行预测。
生成模型:通过生成方法学习得到的模型,例如朴素贝叶斯,混合高斯模型等等。
判别方法:从数据集中直接学习得到决策函数f(x)或是条件概率分布P(Y|X),然后根据得到的决策函数f(x)或是条件概率分布P(Y|X)进行预测。
判别模型:通过判别方法得到的模型,例如:KNN、SVM、决策树、逻辑回归等等。
举个栗子:
判别模型举例:要确定一个羊是山羊还是绵羊,用判别模型的方法是从历史数据中学习到模型,然后通过提取这只羊的特征来预测出这只羊是山羊的概率,是绵羊的概率。
生成模型举例:利用生成模型是根据山羊的特征首先学习出一个山羊的模型,然后根据绵羊的特征学习出一个绵羊的模型,然后从这只羊中提取特征,放到山羊模型中看概率是多少,在放到绵羊模型中看概率是多少,哪个大就是哪个。
细细品味上面的例子,判别模型是根据一只羊的特征可以直接给出这只羊的概率(比如logistic regression,这概率大于0.5时则为正例,否则为反例),而生成模型是要都试一试,最大的概率的那个就是最后结果。
注:本文主要进行名词解释,并没有推导生成方法和判别方法的计算步骤,后续会结合具体的模型推导进行解释~~~
References:https://blog.csdn.net/qq_14845119/article/details/86158553