《统计学习方法》学习笔记(四)——朴素贝叶斯法

  相信大家对贝叶斯定理已经非常熟悉了,不过这里还是先对贝叶斯定理进行一下扫盲介绍。
  预备知识:1、先验概率:用 P(Bi) 表示没有训练数据前假设假设 h 拥有的初始概率,称为先验概率。先验概率反映了关于Bi是一正确假设的机会的背景知识;2、后验概率: P(Bi|A) 为后验概率,给定A时 Bi 成立的概率,称为 Bi 的后验概率;3、极大后验概率:最佳假设 P(Bk|x)=argminkP(x|Bi)P(Bi)P(x) ;4、极大似然估计:假设H中每个假设没有相同的先验概率,可以简化为: P(Bk|x)=argminkP(x|Bi) (极大似然估计有一个博客写的很好,大家参考下,http://blog.csdn.net/zouxy09/article/details/8537620
   P(A|B) 是在B发生的情况下A发生的可能性
假设 B1,......,Bn 为互斥且构成一个完全事件,已知概率 P(Bi),i=1,....,n ,现观察到某事件A与 B1,......,Bn 相伴随机出现,且已知条件概率 P(A|Bi) ,求 P(Bi|A) :
                 P(Bi|A)=P(Bi)P(A|Bi)nj=1P(Bj)P(A|Bj)
即已知 P(A|Bi) (先验信息)与 P(Bi) (样本信息)的情况下,求得 P(Bi|A) (后验信息)
朴素贝叶斯算法:
  step1:设 x=a1,a2,...,am 为一个待分类项,其中 ai x 的一个特征属性;
  step2:有类别集合C={y1,y2,...,yn}
  step3:计算 P(y1|x),P(y2|x),...,P(yn|x)
  step4:若 P(yk|x)=maxk{P(y1|x),P(y2|x),...,P(yn|x)} ,则将 x 分类到第k类;
  下面重点讨论第3步:
  1、找到一个已知分类的待分类项集合,这个集合为训练样本;
  2、统计得到在各类别下各个特征属性的条件概率估计,即 P(a1|y1),...,P(am|y1),P(a1|y2),.....,P(am|y2),....,P(am|yn) ;
  3、各个特征属性相互独立,即有贝叶斯定理如下推到:
   P(yi|x)=P(x|yi)P(yi)P(x) ,由于 P(x) 固定,所以step4选取分子最大是的 i ,所以朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。
  朴素贝叶斯法的基本思路:
  设输入空间xχRn,输出空间 yν=c1,c2,...,ck x χ上的随机向量, Y 是定义在ν上的随机向量, P(X,Y) X Y的联合分布分布。数据集 T=(x1,y1),(x2,y2),...,(xN,yN) P(X,Y) 独立且同分布产生。 P(X,Y) 由学习产生的先验概率分布及条件概率分布求解。
  step1、 P(Y=ck),k=1,2,...,K ——(1)为先验概率分布, P(X=x|Y=ck)=P(X(1)=x(1),X(2)=x(2),...,X(K)=x(K)|Y=ck),k=1,2,....,K ——(2)为条件概率分布。然而由于条件概率分布 P(X=x|Y=ck) 有指数级数量的参数,其估计实际是不可行的,故朴素贝叶斯对条件概率分布做了条件独立性假设:   P(X=x|Y=ck)=P(X(1)=x(1),X(2)=x(2),...,X(K)=x(K)|Y=ck)=ni=1P(X(i)=x(i)|Y=ck) ——-(3).
  step2、朴素贝叶斯分类时,对给定的输入 x ,通过学习得到的模型计算后验概率分布P(Y=ck|X=x),将后验概率最大类作为 x 的类输出:
  P(Y=ck|X=x)=P(Y=ck)P(X=x|Y=ck)Kk=1P(Y=ck)P(X=x|Y=ck)——(4)
将式(3)带入式(4)中,可得:
   P(Y=ck|X=x)=P(Y=ck)P(X(j)=x(j)|Y=ck)Kk=1P(Y=ck)P(X(j)=x(j)|Y=ck) ——-(5)
转化为寻找式(5)的最大后验概率:
y=f(x)=argmaxckP(Y=ck|X=x)=P(Y=ck)P(X(j)=x(j)|Y=ck)P(x) ,将 P(x) 固定,得: y=argmaxckP(Y=ck)ni=1P(X(j)=x(j)|Y=ck) 这就是求解的最大后验概率。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值