基于python的贝叶斯分类算法预测_机器学习模型3 朴素贝叶斯-基于Python sklearn的实现...

最新推荐文章于 2023-01-13 10:56:37 发布

明嘻嘻

最新推荐文章于 2023-01-13 10:56:37 发布

阅读量682

点赞数

文章标签：基于python的贝叶斯分类算法预测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30212009/article/details/112886105

版权

本文详细介绍了基于Python的朴素贝叶斯分类算法，包括模型原理、计算步骤、注意事项，以及如何使用sklearn库中的GaussianNB、MultinomialNB和BernoulliNB。强调了拉普拉斯修正、概率估计和不同分布的选择对分类效果的影响，并提供了一个简单的预测实例。

摘要由CSDN通过智能技术生成

1、模型原理

1、原理：基于概率论的方法，计算一个样本x属于某个类别c的概率最大，即计算P(c│x)的最大值，即样本x分到类别c中的概率最大

1-1.png

。

2、计算步骤：

第一步，通过条件概率，可以转化为

1-2.png

。但由于很多样本取值在训练集中根本没有出现，即很多P(x│c)=0，因此直接使用频率来估计P(x│c) 显然不可行，因为"未被观测到"与"出现概率为零"通常是不同的.

第二步，假设概率密度P(x│c)符合某种确定的概率分布形式，再基于训练样本对概率分布的函数进行极大似然估计，就是在所有可能的参数Θ中，寻找一个能使训练数据出现的“可能性”最大的值。

比如假定在连续属性情形下，数据的概率密度函数P(x│c)符合正态分布，那问题就转化为了，知道一系列的属性数据，估计正态分布的均值、方差两个参数(因为均值、方差两个参数确定了，该正态分布函数也就确定了)，再然后就等于是参数都知道了，然后计算在x处的概率密度，即P(x│c)就知道了。

第三步，

1-3.png

中，p(ci)就是一个类别的占比，比如好瓜占西瓜总数的比例，根据第二步P(x│ci)也求出来了，再计算样本x下，哪个P(

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
基于python的贝叶斯分类算法预测_机器学习模型3 朴素贝叶斯-基于Python sklearn的实现...

1、模型原理1、原理：基于概率论的方法，计算一个样本x属于某个类别c的概率最大，即计算P(c│x)的最大值，即样本x分到类别c中的概率最大1-1.png。2、计算步骤：第一步，通过条件概率，可以转化为1-2.png。但由于很多样本取值在训练集中根本没有出现，即很多P(x│c)=0，因此直接使用频率来估计P(x│c) 显然不可行，因为"未被观测到"与"出现概率为零"通常是不同的.第二步，假设概率密度...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。