朴素贝叶斯分类器NBC
朴素贝叶斯算法是统计学的一种分类方法,利用概率统计知识进行分类。朴素贝叶斯一贝叶斯定理为基础,故统称为贝叶斯分类。
##贝叶斯流派
在提出贝叶斯方法之前,人们认为一件事发生的概率0是未知的但是固定的一件事只有发生或不发生两种可能。
而贝叶斯流派认为一件事发生的概率是个不确定的值,概率是人的一个主观概念,代表了对某件事发生的概率的相信程度。
频率流派:
参数0是一个固定的未知数,同时样本x是随机的,频率派研究的重点是样本空间,概率计算是针对样本x的分布。
贝叶斯流派:
参数0是一个随机变量,样本x是固定的,研究的重点是参数0的分布。
贝叶斯定理Bayes theorem
贝叶斯公式:P(A|B) = P(B|A)P(A)/P(B)
解读:
在B出现的前提下事件A发生的概率,等于A出现的前提下事件B发生的概率,乘以事件A单独发生的概率,再除以事件B单独发生的概率。
朴素贝叶斯分类器
把联合概率P(X1,X2,…,Xn|Y)转化为每个类别条件概率的乘积。
条件独立性
通过计算每个X的条件概率来计算每一个组合类的类条件概率
贝叶斯计算过程
- 首先计算每个类别的后验概率
- 然后比较独立特征的条件概率,将概率最大的那个类别作为该样本的类别