【知识铺垫】
在介绍如何使用贝叶斯概率公式计算后验概率之前,先回顾一下概率论与数理统计中的条件概率和全概率公式:
如上等式为条件概率的计算公式,表示在已知事件A的情况下事件B发生的概率,其中P(AB)表示事件A与事件B同时发生的概率。所以,根据条件概率公式得到概率的乘法公式:。
事件A的概率可以根据全概率公式计算得到:
如上等式即为全概率公式,其中事件构成了一个完备的事件组,并且每一个均大于0。该公式表示,对于任意的一个事件A来说,都可以表示成n个完备事件组与其乘积的和。
【贝叶斯公式】
在具备上述的基础知识之后,再来看看贝叶斯公式。如前文所说,贝叶斯分类器的核心就是在已知X的情况下,计算样本属于某个类别的概率,故这个条件概率的计算可以表示为:
其中,表示样本所属的某个类别。假设数据集的因变量y一共包含k个不同的类别,故根据全概率公式,可以将上式中的分母表示成;再根据概率的乘法公式,可以将上式中的分子重新改写为。对于上面的条件概率公式而言,样本最终属于哪个类别,应该将计算所得的最大概率值