贝叶斯公式推导
基本的贝叶斯公式由来
损失函数
以上目标函数最大根据公式即求P(ck)和P(x|c)最大,根据最大似然估计用采样的值作为其概率分布参数
对于多项式贝叶斯 即求fi*P(xi|ck) 和 该类别的概率的值之和,fi为要分类的文档中单词的出现的次数(下面多项式贝叶斯有推导)
对于伯努利贝叶斯 fi变为1即可
(spark mllib 的多项式贝叶斯分类源码中有体现http://spark.apache.org/docs/latest/api/python/_modules/pyspark/mllib/classification.html#NaiveBayesModel.predict
中的这段代码
return