[贝叶斯五]之朴素贝叶斯

最新推荐文章于 2020-05-17 12:45:00 发布

背包_十年

最新推荐文章于 2020-05-17 12:45:00 发布

阅读量329

点赞数

分类专栏： faicutly 机器学习文章标签：朴素贝叶斯贝叶斯分类机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/neu_chenguangq/article/details/79280843

版权

faicutly 同时被 2 个专栏收录

26 篇文章

订阅专栏

10 篇文章

订阅专栏

一、前因

这一章节依然是基础知识，贝叶斯分类器的核心就是要计算出后验概率 $p(w_i|x)$ ，依据贝叶斯定理

p (w i | x) = p ( x | w i ) p ( w i ) p ( x )

$p(w_i|x) = \frac {p(x|w_i)p(w_i)}{p(x)}$

其中：

$p(w_i)$ 是类别 $i$ 出现的概率，这个比较好求。根据训练样本

\begin{aligned} (1) & p (w_{i}) = \frac{# 类 别 i 训 练 样 本 数}{# 训 练 样 本 总 数} \end{aligned}

$\begin{align} p(w_i) = \frac {\# 类别i训练样本数}{\# 训练样本总数} \end{align}$

$p(x)$ 可以用全概率公式进行计算

但是似然(类别条件概率) $p(x|w_i)$ 该怎么求？很多时候，样本 $x$ 都是多属性的(也就是机器学习中通常说的特征空间是多维度的)。这就是朴素贝叶斯诞生原因。

二、推导

不是说类别条件概率不好求么？而且不好求的原因是样本 $x$ 是多属性的。那么我们就假设属性之间是相互独立的。这就是朴素贝叶斯。基于这个假设，我们用条件概率的乘法原理重写贝叶斯公式。(假设输入样本是 $d$ 维的)

\begin{aligned} (2) & p (w_{i} | x) & = \frac{p (x | w_{i}) p (w_{i})}{p (x)} \\ (3) & = \frac{p (w_{i})}{p (x)} \prod_{k = 1}^{d} p (x_{k} | w_{i}) \end{aligned}

$\begin{align} p(w_i|x) &= \frac {p(x|w_i)p(w_i)}{p(x)}\\ & = \frac {p(w_i)}{p(x)} \prod_{k=1}^d p(x_k|w_i) \end{align}$

继续改写 $p(x)$ ，因为对于所有的类别来说都是相等的。

f = a r g m a x i p (w i | x) = a r g m a x i p (w i) \prod k = 1 d p (x k | w i) (4) (5)

$\begin{align} f &= \underset {i}{argmax} \ p(w_i|x)\\ &=\underset {i}{argmax} \ p(w_i) \prod_{k=1}^d p(x_k|w_i) \end{align}$

这就是朴素贝叶斯的目标函数。

三、参考文献

[1] 周志华. 《机器学习》[M]. 清华大学出版社, 2016.
[2] 李航. 《统计学习方法》[M].清华大学出版社,2013.

<个人网页blog已经上线，一大波干货即将来袭：https://faiculty.com/>

/* 版权声明：公开学习资源，只供线上学习，不可转载，如需转载请联系本人 .*/

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。