朴素
朴素贝叶斯的基础是贝叶斯定理:
贝叶斯定理
P(AB)=P(A)P(B|A)
P(A|B)=[P(B|A)P(A)]/P(B)
在遇到具体情况需要区分不同数据所呈现的类别时,我们需要引用贝叶斯定理。
问题在于,当我们再次应用时:
实际上这是无法或者很难获得的。
因此朴素贝叶斯的朴素之处在于:
它假设样本的属性是相互独立的
因此我们根据独立得到朴素贝叶斯的表达式:
案例
判断好瓜坏瓜
1、计算P(Xi|Y)
拉普拉斯平滑处理
import numpy as np
from sklearn.naive_bayes import GaussianNB
X=np.array([[-1,-1],[-2,-1],[-3,-2],[1,1],[2,1],[3,2]])
Y=np.array([1,1,1,2,2,2])
clf=GaussianNB()
clf.fit(X,Y)
clf.predict([[-0.8,-1]])