贝叶斯公式 P(Y|X)=P(X|Y)P(Y)/P(X)
X表示属性集
Y表示分类
P(Y)称之为Y的先验概率
P(Y|X)称之为Y的后验概率
如果Y分类为yes和no两类 那么 比较P(yes|X)和 P(no|X)的大小就可以知道属性集X属于yes还是no
因为公式中 P(X)是常量可以忽略 ,如果你构建一个Y各分类数量均等的训练样本集,你甚至可以在比较后验概率大小时把P(Y)也忽略掉。
这样,只要比较P(X|Y)就可以了,那么P(X|Y)怎么来算呢?
引入朴素贝叶斯
朴素指的是属性集中所有属性都相对独立,每个属性对分类的权重都相等,这样是为了简化P(X|Y)的计算。
即P(X|Y)在此条件下可以简化为 和