一文读懂朴素贝叶斯（从原理到实现）

最新推荐文章于 2023-12-11 14:19:46 发布

VIP文章 PYIPHANG

最新推荐文章于 2023-12-11 14:19:46 发布

阅读量582

点赞数

分类专栏： ML与DL 文章标签：人工智能机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33397016/article/details/103018510

版权

概述

朴素贝叶斯法是可以用于分类（二分类，多分类）任务。基于三大公式（条件公式，贝叶斯公式，全概率公式），算法首先学习训练数据集的统计特征，然后该统计特性输出测试样本的分类。

背景知识

条件概率公式及理解

P(AB)为联合概率分布，即A,B同时发生的事件，对应途中的相交部分。P(A|B)表示，在B发生的条件下，A发生的概率，说白了，就是A，B相交的区域占B的多少？

2.全概率公式
在这里插入图片描述
其实全概率公式是一个分块的思想。也就是“知因求果，”举个例子：

A=[富，帅]，B=好男人。那么一个男生他是好男人的概率P(B)是多少呢？

本例中，决定一个男生是否为好男人的因素有两个：富，帅。P(B|A=富)表示：在男生富的条件下，他是好男人的概率。P(B|A=帅)表示：在帅的条件下，他是好男人的概率。那么，一个男生是好男人的概率就可以拆分为两部分：因为“富”，所以是好男人 +因为“帅”，所以是好男人，两者的概率之和。

贝叶斯公式、

贝叶斯公式与全概率公式正好相反。全概率公式是“知因求果”，贝叶斯公式是“知果求因”，运用上面的例子，就是说我现在已经知道男生是好男人的，但是他很有钱的概率是多少？这也可以根据条件概率公式跟全概率公式推导出来：
在这里插入图片描述

朴素贝叶斯算法

掌握朴素贝叶斯算法需要掌握以下几点：

朴素贝叶斯的强假设
朴素贝叶斯的思想和原理
参数估计方法
后验概率最大化的含义

朴素贝叶斯的强假设

朴素贝叶斯算法的理论基础是贝叶斯公式，他有一个强假设，即对条件概率分布坐了独立性的假设。
在这里插入图片描述
其中，X(i)可以理解为影响结果的每一个因素，条件概率分布独立意思就是每个因素相互独立，例如说富不会导致你帅。

朴素贝叶斯的思想和原理

朴素贝叶斯的核心就是贝叶斯公式：
在这里插入图片描述
算法的学习过程就是从数据中统计出两个概率分布：

有了这两个分布，就可以通过贝叶斯公式算出

也就是在X是x因素的情况下，Y是ck这个label的概率是多少。最后通过最大化4.7式来确定测试样本点的分类
在这里插入图片描述

参数估计方法:

极大似然法
其实就是算占比，例如P（X=1|Y=1）,先数Y=1的样本有多少个，在从这些样本中看看X=1的样本点占比是多少。这是最简单的情况，实际中会给出P(X|Y)的概率模型，如高斯等
贝叶斯估计
在极大似然法的基础上加上一个常数，防止出现概率为0的情况。

后验概率最大化的含义

为什么要最大化4.7式子？对应的是期望经验风险最小化，具体的推导看书啦，从直观上也很好理解，概率越大，可能性越大嘛。

代码分析

在这里插入图片描述
高斯朴素贝叶斯模型，这里算法是的学习过程就是通过训练样本计算出P(xi|yk)。

计算方差，标准差，高斯模型概率的函数：

def

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
一文读懂朴素贝叶斯（从原理到实现）

概述朴素贝叶斯法是可以用于分类（二分类，多分类）任务。基于三大公式（条件公式，贝叶斯公式，全概率公式），算法首先学习训练数据集的统计特征，然后该统计特性输出测试样本的分类。背景知识条件概率公式及理解 P(AB)为联合概率分布，即A,B同时发生的事件，对应途中的相交部分。P(A|B)表示，在B发生的条件下，A发生的概率，说白了，就是A，B相交的区域占B的多少？2.全概率公式...
复制链接

扫一扫

专栏目录

PYIPHANG CSDN认证博客专家 CSDN认证企业博客

码龄8年

20: 原创

42万+: 周排名

208万+: 总排名

4万+: 访问

: 等级

547: 积分

10: 粉丝

25: 获赞

15: 评论

131: 收藏

私信

关注

热门文章

分类专栏

推荐算法 1篇
论文笔记 5篇
API 1篇
ML与DL 4篇
算法 1篇
C++基础 2篇
Opencv学习 7篇
图像处理 1篇
python 1篇

最新评论

C++vector容器类删除重复元素
weixin_45687866: 哈哈哈笨蛋可还行
（推荐系统）Youtube：Deep Neural Networks for YouTube Recommendations
hold,persist: 请问有这篇文章里用到的数据集吗？
opencv中特征匹配的2NN算法
qq_30780181: 你好，我想问一下，这样滤除是否有一定几率滤除正确的点呢？可否让B和C匹配呢？
（推荐系统）Empirical Analysis of Predictive Algorithms for Collaborative Filtering
ctotalk: thanks
opencv中特征匹配的2NN算法
PYIPHANG 回复 qq_30780181: 举个例子来说我要找A的匹配点。，但是，B点跟A的特征距离很接近，C的跟A的特征距离也很接近，那么B,C哪个才是A的匹配点呢？2NN就看一下这两者比值。极端地说，如果AB与AC距离大小相等，那么比值为1，2NN就会直接过滤掉这个点，认为A没有匹配点

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。