第四章朴素贝叶斯法
朴素贝叶斯(naive Bayes)法是基于贝叶斯定理与 特征条件独立假设的 分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布 P ( X , Y ) P(X,Y) P(X,Y);然后基于此模型,对给定的输入 x x x,利用贝叶斯定理求出后验概率最大的输出 y y y。
4.1 朴素贝叶斯法的学习与分类
4.1.1 基本方法
设输入空间 X ⊆ R n \mathcal{X}\sube{
{\bf R}^n} X⊆Rn为 n n n维向量的集合,输出空间为类标记集合 Y = { c 1 , c 2 , ⋯ , c k } . \mathcal{Y}=\{c_1,c_2,\dotsb,c_k\}. Y={
c1,c2,⋯,ck}.输入为特征向量 x ∈ X x\in\mathcal X x∈X,输出为类标记(class label) y ∈ Y y\in \mathcal Y y∈Y。 X X X是定义再输入空间 X \mathcal X X上的随机向量, Y Y Y是定义在输出空间 Y \mathcal Y Y上的随机变量。 P ( X , Y ) P(X,Y) P(X,Y)是 X X X和 Y Y Y的联合概率分布。训练数据集 T = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , ⋯ , ( x N , y N ) } T=\{(x_1,y_1),(x_2,y_2),\dotsb,(x_{\tiny N},y_{\tiny N})\} T={
(x1,y1),(x2,y2),⋯,(xN,yN)}由 P ( X , Y ) P(X,Y) P(X,Y)独立同分布产生。
朴素贝叶斯法通过训练数据集学习联合概率分布 P ( X , Y ) P(X,Y) P(X,Y)。具体地,学习以下先验概率分布及条件概率分布。先验概率分布 P ( Y = c k ) , k = 1 , 2 , ⋯ , K (4.1) P(Y=c_k),k=1,2,\dotsb,K\tag{4.1} P(Y=ck),k=1,2,⋯,K(4.1)条件概率分布 P ( X = x ∣ Y = c k ) = P ( X ( 1 ) = x ( 1 ) , ⋯ , X ( n ) = x ( n ) ∣ Y = c k ) , k = 1 , 2 , ⋯ , K (4.2) P(X=x|Y=c_k)=P(X^{(1)}=x^{(1)},\dotsb,X^{(n)}=x^{(n)}|Y=c_{\tiny k}),k=1,2,\dotsb,K\tag{4.2} P(X=x∣Y=ck)=P(X(1)=x(1),⋯,X(n)=x(n)∣Y=ck