朴素贝叶斯

最新推荐文章于 2024-10-09 23:25:36 发布

GodGump

最新推荐文章于 2024-10-09 23:25:36 发布

阅读量321

点赞数

分类专栏：机器学习文章标签：概率论机器学习数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GodGump/article/details/124546012

版权

机器学习专栏收录该内容

59 篇文章 0 订阅

订阅专栏

朴素贝叶斯是一种基于贝叶斯定理的分类方法，假设特征之间相互独立。它在处理文本分类和垃圾邮件过滤等问题时，通过计算先验和后验概率来预测类别。当遇到概率为0的情况，拉普拉斯平滑用于修正这个问题，通过分子加一和分母加特征数量来避免零概率。这种方法在小样本情况下也能有效防止概率估计过于敏感。

摘要由CSDN通过智能技术生成

朴素贝叶斯（Naive Bayes ）概述：
其为基于贝叶斯定理与特征条件独立假设的分类方法。朴素贝叶斯分类器发源于古典数学理论，有着坚实的数学基础，以及稳定的分类效率。同时，模型所需估计的参数很少，对缺失数据不太敏感，算法也比较简单
数学知识要求：
先验概率、后验概率、条件概率、贝叶斯公式、条件独立假设（准备充分的话可以考虑多学1个全概率公式）
联合概率举列子：
P(年龄,收入,婚姻|买) = P(年龄|买) * P(收入|买)*P(婚姻|买)
拉普拉斯平滑系数：
在这里插入图片描述

解决问题：某些特征的概率P为0的情况，无论是在全文检索中某个字出现的概率，还是在垃圾邮件分类中，这种情况明显是不太合理的。
理论假设：假定训练样本很大时，每个分量x的计数加1造成的估计概率变化可以忽略不计，但可以方便有效的避免零概率问题
举例：假设在文本分类中，有3个类：C1、C2、C3。在指定的训练样本中，某个词语K1，在各个类中观测计数分别为0，990，10。则对应K1的概率为0，0.99，0.01。于是对这三个量使用拉普拉斯平滑的计算方法如下：1/1003 = 0.001，991/1003=0.988，11/1003=0.011
总结：分子加一，分母加K，K代表类别数目。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。