概述
作为一种分类算法,生成方法朴素贝叶斯与判别方法思路是不一样的。简单地理解,朴素贝叶斯首先找到特征X和输出Y的联合概率,接着根据贝叶斯公式
求得预测类别。
贝叶斯方法的思想可以概括为:数据+先验概率=后验概率。后验概率是我们要得到的概率分布。 而在此基础上,朴素贝叶斯有一个“朴素”、简单的假设,即认为各个特征是条件独立的,这是一个较强的假设,但是在实际较复杂的场景中也能取得较好的结果。
由于自己此前对这一块知识的理解一直不够透彻,想在这里尽量详细地推导一下朴素贝叶斯分类器的原理。为了更好地理解,先捋一下全概率公式和贝叶斯公式这些先验知识,最后给出朴素贝叶斯分类器的目标函数。
一、全概率公式
设事件是样本空间的一个完备事件组(即两两之间互不相交,且并集是全集),且
。那么任意一个事件
可以根据
进行分割,如下图所示:
事件发生的概率表示为:
由条件概率公式可以知道,
因此事件发生的概率写为下式