朴素贝叶斯(naive Bayes)定义
- 基本假设
输入x为n维向量,输出y取值在{c1,…,ck}K个值范围内,训练集样本个数N,假设样本独立同分布,且
特征条件独立 。具体的:
P(X=x|Y=ck)=P(X(1)=x(1),…,X(n)=x(n)|Y=ck)=∏nj=1P(X(j)=x(j)|Y=ck)
由于这一假设,朴素贝叶斯的学习大为简化,但对分类性能有一定影响
- 学习参数
用极大似然估计来学习先验概率分布 P(Y=ck) 以及条件概率分布 P(X=x|Y=ck)=P(X(1)=x(1),…,