1,贝叶斯定理。
贝叶斯定理如下:
P ( B|A )=P ( A | B ) P ( B )/P(A)
式中, P ( BA )是后验概率,是在条件 A 发生的情况下 B 发生的概率; P ( H )是先验概率,或称为 H 的先验概率,即不考虑其他的情况下 H 发生概率; P ( AIB )和 P ( BIA )一样,也
是后验概率。
2,普速贝叶斯的基本模型。
从统计学知识回到我们的数据分析。假如我们的分类模型样本是:
(x(1)1,x(1)2,...x(1)n,y1),(x(2)1,x(2)2,...x(2)n,y2),...(x(m)1,x(m)2,...x(m)n,ym)(x1(1),x2(1),...xn(1),y1),(x1(2),x2(2),...xn(2),y2),...(x1(m),x2(m),...xn(m),ym)
即我们有m个样本,每个样本有n个特征,特征输出有K个类别,定义为C1,C2,...,CKC1,C2,...,CK。
从样本我们可以学习得到朴素贝叶斯的先验分布P(Y=Ck)(k=1,2,...K)P(Y=Ck)(k=1,2,...K),接着学习到条件概率分布P(X=x|Y=Ck)=P(X1=x1,X2=x2,...Xn=xn|Y=Ck)P(X=x|Y=Ck)=P(X1=x1,X2=x2,...Xn=xn|Y=Ck),然后我们就可以用贝叶斯公式得到X和Y的联合分布P(X,Y)了。联合分布P(X,Y)定义为:
P(X,Y=Ck)=P(Y=Ck)P(X=x|Y=Ck)=