机器学习笔记(六)——朴素贝叶斯法的参数估计

一、极大似然估计

在上一笔记中,经过推导,得到了朴素贝叶斯分类器的表示形式:

y=argmaxckP(Y=ck)jP(X(j)=x(j)|Y=ck)(1)

也就是说,朴素贝叶斯方法的学习是对概率 P(Y=ck) P(X(j)=x(j)|Y=ck) 的估计。故可以用极大似然估计法估计上述先验概率和条件概率。


先验概率 P(Y=ck) 的极大似然估计为:

P(Y=ck)=Ni=1I(yi=ck)N,k=1,2,,K

条件概率 P(X(j)=ajl|Y=ck) 的极大似然估计是:

P(X(j)=ajl|Y=ck)=Ni=1I(x(j)i=ajl,yi=ck)Ni=1I(yi=ck)

其中, x(j)i 是第i个样本的第j个属性; ajl 是第j个属性可能取l的值; I 是指示函数。


将上述两个极大似然估计的值求出后,根据(1)式确定输入实例的分类。

二、贝叶斯估计

由(1)式可以得知,用极大似然估计可能导致估计出来的概率为0的情况,这会影响后验概率的计算结果,使得后验概率为0,解决这一问题的方法是采用贝叶斯估计。


先验概率Pλ(Y=ck)的贝叶斯估计是:

P(Y=ck)=Ni=1I(yi=ck)+λN+Kλ

条件概率 Pλ(X(j)=ajl|Y=ck) 的极大似然估计是:

Pλ(X(j)=ajl|Y=ck)=Ni=1I(x(j)i=ajl,yi=ck)+λNi=1I(yi=ck)+Sjλ

上式中, λ0 ,等价于在随机变量各个取值的频数上加上一个正数 λ>0 。当 λ=0 时就是极大似然估计。取 λ=1 称为拉普拉斯平滑(Laplace smoothing)。

显然对于任何 l=1,2,,Sj;k=1,2,,K 有:

Pλ(X(j)=ajl|Y=ck)>0

l=1SjP(X(j)=ajl|Y=ck)=1

总结

朴素贝叶斯方法的原理和重点内容到目前用了三节内容就重点学习完了,接下来会进一步学习跟贝叶斯相关的贝叶斯网络的内容。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值