一、原理
与其他大多数的分类算法不同,如:决策树、KNN、逻辑回归等,它们都是判别方法,直接学习出类别y和特征x之间的关系。朴素贝叶斯属于生成方法,它的理论基础是贝叶斯公式: P ( Y ∣ X ′ ) = P ( X ′ ∣ Y ) P ( Y ) P ( X ) P(Y|X')=\frac {P(X'|Y)P(Y)}{P(X)} P(Y∣X′)=P(X)P(X′∣Y)P(Y),其中P(Y)是先验知识,P(X’|Y)是已知果,求因出现的概率。而“朴素”一词指的是假设特征X之间相互独立。与频率学派的不同点在于,贝叶斯加入了先验知识的影响。贝叶斯算法计算量不大,在文本分类中有很好的效果。
下面说一下朴素贝叶斯的推导过程:
我们的目标是对给定的样本特征X,计算其所属分类,即求 P ( Y = C k ∣ X ) P(Y=C_k|X) P(Y=Ck∣X),设 C k C_k Ck为第k个类别,根据贝叶斯公式,也就是:
P ( Y = C k ∣ X t e s t ) = P ( X t e s t ∣ Y = C k ) P ( Y = C k ) P ( X ) P(Y=C_k|X^{test})=\frac {P(X^{test}|Y=C_k)P(Y=C_k)}{P(X)} P(Y=Ck∣