机器学习算法（三）基于概率论的分类方法：朴素贝叶斯

最新推荐文章于 2024-07-31 09:18:11 发布

双杰_

最新推荐文章于 2024-07-31 09:18:11 发布

阅读量183

点赞数

文章标签：机器学习算法概率论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28976599/article/details/131176352

版权

朴素贝叶斯是一种生成方法，通过找出特征与输出的联合分布进行分类。与其他判别模型如KNN、逻辑回归不同，它计算概率。拉普拉斯平滑用于解决零概率问题，增强模型的鲁棒性。朴素贝叶斯在数据量小的情况下也能有效工作，适用于多类别问题，尤其在文本分类中有广泛应用，但对数据预处理敏感。

摘要由CSDN通过智能技术生成

看这俩吧
链接: 图解机器学习 | 朴素贝叶斯算法详解
链接: 带你理解朴素贝叶斯分类算法
链接: 理解朴素贝叶斯分类的拉普拉斯平滑

引言

在众多机器学习分类算法中，本篇我们提到的朴素贝叶斯模型，和其他绝大多数分类算法都不同，也是很重要的模型之一。

在机器学习中如KNN、逻辑回归、决策树等模型都是判别方法，也就是直接学习出特征输出和特征之间的关系（决策函数或者条件分布）。但朴素贝叶斯是生成方法，它直接找出特征输出和特征的联合分布，进而通过在这里插入图片描述
计算得出结果判定。
换个表达形式就会明朗很多，如下：

朴素贝叶斯是一个非常直观的模型，在很多领域有广泛的应用，比如早期的文本分类，很多时候会用它作为 baseline 模型，本篇内容我们对朴素贝叶斯算法原理做展开介绍。

1，朴素贝叶斯算法核心思想

其它分类算法相对来说主要求的是一个特定的分类，而朴素贝叶斯算法求的是概率。例如给出一张照片，判断是什么动物。如果使用KNN或者决策树，会得出它是一只小狗，而使用朴素贝叶斯，则会打出小狗的概率是80%。

2.拉普拉斯平滑及依据

为了解决零概率的问题，法国数学家拉普拉斯最早提出用加1的方法估计没有出现过的现象的概率，所以加法平滑也叫做拉普拉斯平滑。
假定训练样本很大时，每个分量x 的计数加 1 造成的估计概率变化可以忽略不计，但可以方便有效的避免零概率问题。
对应到文本分类的场景中，如果使用多项式朴素贝叶斯，假定特征 x 表示某个词在样本中出现的次数（当然用TF-IDF表示也可以）。拉普拉斯平滑处理后的条件概率计算公式为：在这里插入图片描述

3.优缺点

优点：在数据较少的情况下仍然有效，可以处理多类别问题。
缺点：对于输入数据的准备方式较为敏感。
适用数据类型：标称型数据。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

双杰_ CSDN认证博客专家 CSDN认证企业博客

码龄9年

34: 原创

9万+: 周排名

5万+: 总排名

4万+: 访问

: 等级

435: 积分

15: 粉丝

11: 获赞

4: 评论

61: 收藏

私信

关注

热门文章

分类专栏

最新评论

maya python调试（pycharm）
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
虚幻动画系统概述
简单简单小白: 大佬非常清晰的分析思路给我带来了很多收获，希望大佬持续创造，我们共同学习
3dmax工具开发
双杰_: 先做几个简单的例子，然后后面有需求直接查官方文档就行了。这个主要是找api花时间
3dmax工具开发
LBMH: 大佬3dsMax pythonAPI 的学习路径是怎么样的呢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。