1. 引言
朴素贝叶斯算法(Naive Bayes)是机器学习中常见的基本算法之一,主要用来做分类任务的。它是基于贝叶斯定理与条件独立性假设的分类方法。对于给定的训练数据集,首先基于特征条件独立性假设学习输入/输出的联合概率分布,然后基于此模型,对于给定的输入 x利用贝叶斯定理求出后验概率最大的输出 y 。
基于以上的解释,我们知道:
1. 该算法的理论核心是贝叶斯定理;
2. 它是基于条件独立性假设这个强假设之下的,这也是该算法为什么称为“朴素”的原因。
3.它的另一个假设是,每个特征同等重要
前言:在了解朴素贝叶斯的算法之前,我们需要对相关的统计学知识做一个回顾。
监督学习的任务就是学习一个模型,应用这一模型,对给定的输入预测相应的输出。这个模型的一般形式为决策函数:或者条件概率分布: