这次需要总结的是朴素贝叶斯算法,参考文章:
简介
朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类方法。
贝叶斯定理是基于条件概率来计算的,条件概率是在已知事件B发生的前提下,求解事件A发生的概率,即 P(A|B)=P(AB)P(B) ,而贝叶斯定理则可以通过 P(A|B) 来求解 P(B|A) :
P(B|A)=P(A|B)P(B)P(A)
其中分母 P(A) 可以根据全概率公式分解为: P(A)=∑ni=1P(Bi)P(A|Bi)
而特征条件独立假设是指假设各个维度的特征 x1,x2,...,xn 互相独立,则条件概率可以转化为:
P(x|yk)=P(x1,x2,...,xn|yk)=∏i=1nP(xi|yk)
朴素贝叶斯分类器可表示为:
f(x)=argmaxykP(yk|x)=argmax</