更多内容关注公众号:数学的旋律
tb店铺搜:FUN STORE玩物社,专业买手挑选送礼好物
引言
朴素贝叶斯(naïve Bayes)法是基于贝叶斯定理与特征条件独立假设的分类方法。在统计学中,相互独立的含义是它们中一个已发生,不影响另一个发生的概率,即特征条件独立指一个特征出现的可能性与它的相邻没有关系。
基本思想如下:
假设训练集标记类别集合为{c1,c2},P(c1|x1,x2)为给定数据点(x1,x2)来自类别c1的概率;P(c2|x1,x2)为给定数据点(x1,x2)来自类别c2的概率。若P(c1|x1,x2) > P(c2|x1,x2),数据点属于c1;若P(c1|x1,x2) < P(c2|x1,x2),数据点属于c2。
具体地可利用贝叶斯定理计算概率值。运算中,利用了特征条件独立的假设,由于这是一个较强的假设,使整个形式化过程变得原始简单,“朴素”由此得名。
一、数学预备知识
1.条件概率
设A,B是两个事件,且P(A)>0,称
P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A)={P(AB)\over{P(A)}} P(B∣A)=P(A)P(AB)为在事件A发生的条件下事件B发生的条件概率。
2.乘法公式
P(A)>0,则有
P ( A B ) = P ( B ∣ A ) P ( A ) P(AB)=P(B|A)P(A) P(AB)=P(B∣A)P(A)上式称为乘法公式。
3.全概率公式
设试验E的样本空间为S,A为E的事件,B1,B2,…,Bn为S的一个划分(即BiBj=∅,i≠j,i,j=1,2,…,n,且P{B1∪B2∪…∪Bn}=1),且P(Bi)>0(i=1,2,…,n),则
P ( A ) = P ( A ∣ B 1 ) P ( B 1 ) + P ( A ∣ B 2 ) P ( B 2 ) + … + P ( A ∣ B n ) P ( B n ) P(A)=P(A|B_1)P(B_1)+P(A|B_2)P(B_2)+…+P(A|B_n)P(B_n) P(A)=P(A∣B1)P(B1)+P(A∣B2)P(B2)+…+P(A∣Bn)P(Bn)上式称为全概率公式。
4.贝叶斯公式
设试验E的样本空间为S,A为E的事件,B1,B2,…,Bn为S的一个划分(即BiBj=∅,i≠j,i,j=1,2,…,n,且P{B1∪B2∪…∪Bn}=1),且P(A)>0,P(Bi)>0(i=1,2,…,n),则
P ( B i ∣ A ) = P ( B i A ) P ( A ) = P ( A ∣ B i ) P ( B i ) ∑ j = 1 n P ( A ∣ B j ) P ( B j ) P(B_i|A)={
{P(B_iA)}\over{P(A)}}={
{P(A|B_i)P(B_i)}\over{\sum_{j=1}^nP(A|B_j)P(B_j)}} P(Bi∣A)=P(A)P(BiA)=∑j=1nP(A∣Bj)P(Bj)P(A∣Bi)P(Bi)上式称为贝叶斯公式。
5.独立的定义
设A,B是两事件,如果满足等式
P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B)则称事件A,B相互独立,简称A,B独立。
二、朴素贝叶斯分类器
设输入空间X是n维实数向量空间 R n R^n Rn,输出空间为标记类别集合 Y = { c 1 , c 2 , ⋯ , c k } Y=\{c_1,c_2,\cdots,c_k\} Y={
c1,c2,⋯,ck}。训练集为:
D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , ⋯ , ( x N , y N ) } D=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\} D={(x1,y1),(x2,y2),⋯,(xN,yN)}其中 x i = ( x i ( 1 ) , x i ( 2 ) , ⋯ , x i ( i ) , ⋯ , x i ( n ) ) T x_i=(x_i^{(1)},x_i^{(2)},\cdots,x_i^{(i)},\cdots,x_i^{(n)})^T xi=(xi(1),xi(2),⋯,xi(i),⋯,xi(n))T, x i ( j ) x_i^{(j)} xi(j)是第i个实例的第j个特征。
设测试实例为 x = ( x ( 1 ) , x ( 2 ) , ⋯ , x ( n ) ) T x=(x^{(1)},x^{(2)},\cdots,x^{(n)})^T x=(x(1),x(2),⋯,x(n))T,其中 x ( i ) x^{(i)} x