前面介绍的kNN和决策树都给出了“该数据实例属于哪一类”这类问题的明确答案,而有时候的分类并不能给出明确的答案,本节讲解使用概率论进行分类的方法。
1:简单概念描述
概念比较简单,这里我摘抄自百度百科,很容易理解。
朴素贝叶斯模型(NaiveBayesian classification)):
----
Vmap=arg max P( Vj | a1,a2...an)
Vj属于V集合
其中Vmap是给定一个example,得到的最可能的目标值.
其中a1...an是这个example里面的属性.
这里面,Vmap目标值,就是后面计算得出的概率最大的一个.所以用max来表示
----
贝叶斯公式应用到 P(Vj | a1,a2...an)中.
可得到Vmap= arg max P(a1,a2...an | Vj ) P( Vj ) / P (a1,a2...an)
又因为朴素贝叶斯分类器默认a1...an他们互相独立的.
所以P(a1,a2...an)对于结果没有用处