贝叶斯分类
贝叶斯分类是基于贝叶斯定理和属性特征条件独立性的分类方法。
贝叶斯分类:
1.计算先验概率
2.为每个属性计算条件概率
3.计算后验概率
贝叶斯公式:
p(c|x) = p(x,c)/p(x) = p©p(x|c) / p(x)
p(类别 | 特征) = p(特征 | 类别)p(类别) / p(特征)
拉普拉斯修正(防止分子中有概率为零的)
先验概率拉普拉斯修正
条件概率拉普拉斯修正
贝叶斯算法优点:
(1)算法逻辑简单,易于实现
(2)分类过程中时空开销小
缺点:
理论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率,但是实际上并非总是如此,这是因为朴素贝叶斯模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多或者属性之间相关性较大时分类效果不好。