X={x1,x2,...,xn},Y={y1,y2,...,ym}
根据贝叶斯公式:p(y|x) * p(x) = p(x|y)*p(y)
argmax p(y|X) = argmaxP(X|y)p(y),即给定X,计算X属于每个分类的概率,将它归为概率最大的那一类
因此,只需要求出p(X|y)和p(y)即可,即对p(X|y)和p(y)建模
在朴素贝叶斯算法中,X的特征是相互独立的,即p(X|y)=p(x1|y)*p(x2|y)*...*p({xn|y)
当特征属性为离散值时,只需要统计训练样本中各个属性在每个类别出现的频率即可用来估计p(xi|y)。