一、介绍
1、朴素贝叶斯(naive bayesian)是常见的一种利用先验概率进行分类的分类器。朴素贝叶斯的前提假设条件是所有的特征的条件之间相互独立。
2、朴素贝叶斯模型作为以条件概率为基础的分类器是一种监督学习的算法,常用于文本分类和垃圾邮件过滤的场景中。
3、“朴素”指的是在整个过程中所使用的是最简单的假设。
二、原理
1、贝叶斯分类器的原理是通过某对象的先验概率,利用贝叶斯公式计算出它的后验概率,选取具有最大后验概率的类作为该对象的所属的类。
2、贝叶斯理论决策的核心
用P1(x,y)来表示数据点(x,y)属于类别1
P2(x,y)表示数据点(x,y)属于类别2
对于一个新的数据点(x,y)如果P1(x,y)>P2(x,y)为类别1,否则为类别2。选择高概率的对应的类别。
3、贝叶斯定理
条件概率:
P(AB)是B发生条件下A发生的概率
那么贝叶斯定理: