机器学习笔记（六）——朴素贝叶斯法的参数估计

最新推荐文章于 2024-06-25 06:30:00 发布

_Kevin_Duan_

最新推荐文章于 2024-06-25 06:30:00 发布

阅读量6.7k

点赞数 1

分类专栏：机器学习文章标签：机器学习朴素贝叶斯

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chunyun0716/article/details/51111864

版权

机器学习专栏收录该内容

30 篇文章 12 订阅

订阅专栏

一、极大似然估计

在上一笔记中，经过推导，得到了朴素贝叶斯分类器的表示形式：

$y = a r g max c k P (Y = c k) \prod j P (X (j) = x (j) | Y = c k) (1)$ $y = arg \max_{c_k} P(Y=c_k)\prod_jP(X^{(j)} = x^{(j)}| Y=c_k) (1)$

也就是说，朴素贝叶斯方法的学习是对概率 $P(Y=c_k)$ 和 $P(X^{(j)} = x^{(j)}| Y=c_k)$ 的估计。故可以用极大似然估计法估计上述先验概率和条件概率。

先验概率 $P(Y=c_k)$ 的极大似然估计为：

P (Y = c k) = \sum N i = 1 I ( y i = c k ) N, k = 1, 2, \dots, K

$P(Y=c_k) = \frac{\sum_{i=1}^{N}I(y_i=c_k)}{N}, k=1,2, \dots, K$

条件概率 $P(X^{(j)} = a_{jl}| Y=c_k)$ 的极大似然估计是：

P (X (j) = a j l | Y = c k) = \sum N i = 1 I ( x ( j ) i = a j l , y i = c k ) \sum N i = 1 I ( y i = c k )

$P(X^{(j)} = a_{jl}| Y=c_k) = \frac{\sum_{i=1}^{N}I(x_i^{(j)} = a_{jl},y_i=c_k)}{\sum_{i=1}^{N}I(y_i=c_k)}$
其中，

x(j)i $x_i^{(j)}$ 是第i个样本的第j个属性；

ajl $a_{jl}$ 是第j个属性可能取l的值；

I $I$ 是指示函数。

将上述两个极大似然估计的值求出后，根据（1）式确定输入实例的分类。

二、贝叶斯估计

由（1）式可以得知，用极大似然估计可能导致估计出来的概率为0的情况，这会影响后验概率的计算结果，使得后验概率为0，解决这一问题的方法是采用贝叶斯估计。

先验概率 $P_{\lambda}(Y=c_k)$ 的贝叶斯估计是：

P (Y = c k) = \sum N i = 1 I ( y i = c k ) + λ N + K λ

$P(Y=c_k) = \frac{\sum_{i=1}^{N}I(y_i=c_k)+\lambda}{N+K\lambda}$

条件概率 $P_{\lambda}(X^{(j)} = a_{jl}| Y=c_k)$ 的极大似然估计是：

P λ (X (j) = a j l | Y = c k) = \sum N i = 1 I ( x ( j ) i = a j l , y i = c k ) + λ \sum N i = 1 I ( y i = c k ) + S j λ

$P_{\lambda}(X^{(j)} = a_{jl}| Y=c_k) = \frac{\sum_{i=1}^{N}I(x_i^{(j)} = a_{jl},y_i=c_k)+\lambda}{\sum_{i=1}^{N}I(y_i=c_k)+S_j\lambda}$

上式中， $\lambda \ge 0$ ，等价于在随机变量各个取值的频数上加上一个正数 $\lambda > 0$ 。当 $\lambda = 0$ 时就是极大似然估计。取 $\lambda = 1$ 称为拉普拉斯平滑（Laplace smoothing）。

显然对于任何 $l =1,2, \dots,S_j; k=1,2 ,\dots,K$ 有：

P λ (X (j) = a j l | Y = c k) > 0

$P_{\lambda}(X^{(j)} = a_{jl}| Y=c_k) >0$

\sum l = 1 S j P (X (j) = a j l | Y = c k) = 1

$\sum_{l=1}^{S_j}P(X^{(j)} = a_{jl}| Y=c_k) =1$

总结

朴素贝叶斯方法的原理和重点内容到目前用了三节内容就重点学习完了，接下来会进一步学习跟贝叶斯相关的贝叶斯网络的内容。

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。