朴素贝叶斯的三个常用模型：高斯、多项式、伯努利

最新推荐文章于 2024-08-14 22:32:50 发布

琥珀彩

最新推荐文章于 2024-08-14 22:32:50 发布

阅读量5.3k

点赞数 4

分类专栏：机器学习与数据挖掘算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ac540101928/article/details/103941495

版权

本文详细介绍了朴素贝叶斯分类器的三种模型：多项式、伯努利和高斯模型。分别阐述了它们的计算原理，如多项式模型基于单词独立假设，伯努利模型考虑文件粒度，高斯模型用于处理连续特征变量。通过实例展示了如何使用这些模型进行文档分类，并对比了它们之间的区别。

摘要由CSDN通过智能技术生成

部分内容转自：https://blog.csdn.net/qq_27009517/article/details/80044431

0.朴素贝叶斯

朴素贝叶斯分类（NBC，Naive Bayes Classifier）是以贝叶斯定理为基础并且假设特征条件之间相互独立的方法，先通过已给定的训练集，以特征词之间独立作为前提假设，学习从输入到输出的联合概率分布，再基于学习到的模型，输入X，求出使得后验概率最大的输出Y。

设样本数据集 $D=\begin{Bmatrix} d_{1},d_{2},...,d_{n} \end{Bmatrix}$ ，

对应样本数据的特征属性集为 $X=\begin{Bmatrix} x_{1},x_{2},...,x_{k} \end{Bmatrix}$ ，

类别集 $Y=\begin{Bmatrix} y_{1},y_{2},...,y_{m} \end{Bmatrix}$ 。

即D可以分为m种类别。其中 $x_{1},x_{2},...,x_{k}$ 相互独立同分布且随机。

那么Y的先验概率为P(Y)，Y的后验概率为P(Y|X)。由贝叶斯定理可以得到，后验概率可以由证据P(X)，先验概率P(Y)，条件概率P(X|Y)计算得出，公式如下所示：

$P(Y|X)=\frac{P(X|Y)*P(Y)}{P(X)}$

换成分类的示意表达式：

$P(class|sample feature)=\frac{P(sample feature|class)*P(class)}{P(sample feature)}$

朴素贝叶斯基于各个特征之间相互独立，在给定取值时，可以将上式进一步写为

$P(X|Y=y)=\prod_{i=1}^{d} {P(X_{i}|Y=y)}$

$P(Y=y|X)=\frac{\prod_{i=1}^{d}P(X_{i}|Y=y)*P(Y=y)}{P(X)}$

因为P(X)的值是固定不变的，因此在比较后验概率时，只需要比较上式的分子即可。因此可以得到一个样本数据属于类别 $y_{i}$

的朴素贝叶斯计算如下图所示：

最低0.47元/天解锁文章

关注

4
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。