朴素贝叶斯算法是机器学习的一个重要算法,尤其是在分类问题上,非常著名。
朴素贝叶斯原理
朴素贝叶斯算法使用每个属性归属于某个类的概率来做预测。这是一种监督学习方法,需要对已归类属性的样本集做概率建模,然后用它对未知样本做预测。
朴素贝叶斯的优势在于它给出了一个强假定:假设每个属性归属于某类的概率独立于其余所有属性。从而简化了概率的计算,产生了一个快速有效的方法。
从概率论的角度来讲,给定一个属性值A,其属于某个类B的概率叫做条件概率P(B|A)。
条件概率公式告诉我们: P(AB)=P(A)P(B|A)=P(B)P(A|B)
由它推导出贝叶斯公式:(常称P(Bi|A)we后验概率,P(Bi)P(A|Bi)为先验概率,P(Bi)为基础概率)