今天将为大家介绍机器学习中的一个经典的分类算法:朴素贝叶斯分类。在一些情况下,朴素贝叶斯分类器可以达到和神经网络或者决策树同样的性能。为了说明白朴素贝叶斯分类器的原理,我们先从概率论的一些概念上入手。
1.随机事件
事件:随机试验中每一种可观测的结果
必然事件:每次试验中肯定会出现的结果(比如在地球上,太阳每天都从东方升起,西方落下)
不可能事件:每次试验中都不出现的结果(比如掷一颗正常色子,朝上为7的事件即为不可能事件)
随机事件:可能出现,也可能不出现的结果
2.互斥事件(或者称为互不相容事件)
即A事件与B事件不能同时发生
3.完备事件组
如果n个事件A1,A2,...,An两两互不相容,且Ai(i=1, 2, 3, ....,n)包含了所有的可能,那么称A1,A2,......,An构成了一个完备事件组
4.条件概率
P(A | B):在B发生的条件下A发生的概率。通常也称条件概率为后验概率,与之相反的先验概率为P(A),或者P(B)
5.全概率公式
假设事件A1,A2,......,An是一个完备事件组(且P(Ai) > 0),则对任意事件B,都有
6.贝叶斯公式(朴素贝叶斯