朴素贝叶斯分类(NBC)是机器学习中最基本的分类方法,是其他众多分类算法分类性能的对比基础,其他的算法在评价性能时都在NBC的基础上进行。同时,对于所有机器学习方法,到处都蕴含着Bayes统计的思想。
朴素贝叶斯基于贝叶斯地理和特征条件独立性假设,首先基于条件独立性假设学习输入 X 和输出
基本定义
输入空间 Rn 为特征化的 n 维向量样本集合,输出空间为类别集合
Xi={
x(1)i,x(2)i,x(3)i,...,x(n)i}
每一个 x(d)i 代表第 i 个样本的第
整个样本集可以表示如下:
T={
(X1,y1),(X2,y2),...,(XN,yN)}
其中 N 为样本集中样本的数目。
模型
根据统计学中的大数定律,当样本量足够大时,样本的各个统计量,如