多项式朴素贝叶斯(multinomial Naive Bayes)或者多项式NB(multinomial NB)模型, 它是一种基于概率的学习方法。该方法中,文档d 属于类别c 的概率的计算方法如下:
在文本分类中,我们的目标是找出文档最可能属于的类别。对于NB 分类来说,最可能的类是具有MAP(maximum a posteriori,最大后验概率)估计值的结果cmap:
下图为多项式NB 的训练和分类算法伪代码
下面是一个例子简单解析这个算法
java代码实现
package test5;
import java.util.ArrayList;
import java.util.Map.Entry;
import java.util.TreeMap;
class Node{
ArrayList<String> V;
double[] prior;
double[][] condprob;
Node(){
V=new ArrayList<String>();
}
}
public class MultinomialNB {
public stati