假设有两个标签labA,labB
在这两个标签都会出现若干个关键字(假设出现a,b,c三种关键字)
只是每个关键字在两个标签中出现的概率不同(假设A中a,b,c出现的概率为0.1,0.8,0.1;B中a,b,c出现的概率为0.5,0.2,0.3)
如果同时出现ab,分别计算在labA,labB中同时出现ab 的概率?(即 a*b)
假设计算结果(output)为 A_ab,B_ab
则将他们相加(sum)为 sum(A_ab+B_ab)
朴素贝叶斯即为: sum/output
通过最后结果我们可以判断,这个是属于labA 还是labB.
但是朴素贝叶斯也有一个缺点,就是不能确定出现的先后顺序,即使如此,也足够我们使用了。