朴素贝叶斯分类器

最新推荐文章于 2024-07-20 21:16:46 发布

Hearthougan

最新推荐文章于 2024-07-20 21:16:46 发布

阅读量2.1k

点赞数 3

分类专栏： Machine Learning 文章标签： Bayes 分类器朴素

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hearthougan/article/details/75332267

版权

本文通过实例介绍朴素贝叶斯分类器的工作原理。它基于贝叶斯公式和特征间的独立性假设，通过计算后验概率来决定分类。文章讨论了如何处理未出现的特征值，介绍了拉普拉斯修正来解决概率为零的问题，并提供了实际应用示例。

摘要由CSDN通过智能技术生成

分类器是根据某一事物一系列特征来判断该事物的类别。朴素贝叶斯分类器就是根据先验概率应用贝叶斯公式来求解后验概率的一种分类器，哪种类别的概率大，就划分为哪种类别。（先验概率和后验概率不熟悉的请看最大似然估计），其实原理很简单，并不需要什么复杂的训练结构，复杂只是计算量，这个交给计算机即可，所以懂了原理，朴素贝叶斯分类器也就掌握了。先不写理论，以例子开始，希望能说的浅显易懂。

一、西瓜的好坏

这里是要借鉴周志华老师书中西瓜的例子的形式，这用这类例子讲解贝叶斯分类问题容易理解。现作简化如下：

现已知7个西瓜的好坏，西瓜的特征有三种：色泽{青绿、乌黑、浅白}，根蒂{蜷缩、稍蜷、硬挺}，敲声{浊响、沉闷、清脆}，不同特征之间的组合，对应着西瓜的好坏，如下表：

现在拿来一个新的西瓜，只知道它具有如下特征，问这个西瓜是好是坏？

要得出好瓜还是坏瓜，就要看他们分别对应的概率，谁大就是谁。

怎么求解呢？根据贝叶斯公式可以根据已知条件来求解

、

这两个哪个概率大，西瓜就属于那一类。贝叶斯公式忘记的，请看浅谈全概率公式和贝叶斯公式

由上述公式我们可以看出分母都是一样的，因此在计算的时候这个可以忽略，不影响最终的结果。对与分子中好瓜与坏瓜对应的概率，我们可以根据已知的数据，计算好瓜与坏瓜的比例即可：

那么对于，这是关于特征的联合概率，该怎么求呢？直接根据出现频率来作为概率？那么不好意思，上述情况没有在给出的数据中出现！但是如果这些特征之间是相互独立的，那就容易了，因为每个特征取值出现的频率还是很好求的，分别对应相乘即可。比如p(蜷缩|好瓜=是) = 2/3。上述公式就化为如下形式：

为什么要这么做呢？这就要说到朴素贝叶斯的由来了。

二、”朴素”由来

所谓朴素就是假设特征之间是相互独立的

最低0.47元/天解锁文章

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。