朴素贝叶斯采取了属性条件独立的假设,即我们所说的特征,相互之间是独立的。
朴素贝叶斯的目标函数:
若每个样本的风险都最小化,那么整体的风险也将最小化,即在每个样本上选择能使最小的类别标记 ,误判损失
此时条件风险为: ,故最小化分类错误率的贝叶斯最优分类器为
判别式模型:给定,可通过直接建模来预测
生成模型:先对联合概率分布建模,然后由此获得
对贝叶斯定理可写为:
贝叶斯学派认为参数是未观察到的随机变量,其本身也有分布,因此可以假设参数服从先验分布,然后基于观察到的数据来计算参数的后验分布,这便是采样估计参数的方法。
令表示训练集中第类样本组成的集合,假设这些样本是独立同分布的,则参数对数据集的似然是
由于对所有类别来说均相同,因此,故判别准则为