1. 基础概念
什么是朴素贝叶斯:贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。
贝叶斯公式:
P(Y|X)=P(X|Y)P(Y)P(X) P ( Y | X ) = P ( X | Y ) P ( Y ) P ( X )
X
:特征向量
Y
:类别
先验概率 P(X) P ( X ) :先验概率:是指根据以往经验和分析得到的概率。
后验概率 P(Y|X) P ( Y | X ) :事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小。
类条件概率 P(X|Y) P ( X | Y ) :在已知某类别的特征空间中,出现特征值X的概率密度。
朴素:朴素贝叶斯算法是假设各个特征之间相互独立,也是朴素这词的意思。那么贝叶斯公式中 P(X|Y) P ( X | Y ) 可写成
P(X|Y)=P(x1|Y)P(x2|Y)⋯P(x