机器学习之朴素贝叶斯分类器原理详解、公式推导（手推）、面试问题、简单实例(1)

2401_84263114

已于 2024-04-16 08:45:47 修改

阅读量318

点赞数 3

分类专栏： 2024年程序员学习文章标签：机器学习面试人工智能

于 2024-04-16 08:45:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84263114/article/details/137807956

版权

本文详细介绍了朴素贝叶斯分类器的原理，通过实例展示了如何利用Python进行实现，包括数据集创建、模型训练与评估。同时，探讨了在处理连续型数据时的挑战及解决方案，并提供了防止下溢的策略。最后，文章还讨论了面试中可能遇到的相关问题，以加深读者对朴素贝叶斯的理解。

摘要由CSDN通过智能技术生成

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新软件测试全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上软件测试知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip1024b （备注软件测试）

正文

E

0

∣

R

1

)

P(\ A_0\ B_0\ C_0\ D_0\ E_0\ |\ R_1)

P( A0 B0 C0 D0 E0 ∣ R1) 为 0 和

P

(

A

0

B

0

C

0

D

0

E

0

)

P(\ A_0\ B_0\ C_0\ D_0\ E_0)

P( A0 B0 C0 D0 E0) 为 0 的情况，毕竟总有一类人的条件在相亲市场中不受欢迎，但是因为这是在小样本数据中的结果，并不能真实代表这个概率，直接判定 0 显然不可靠。
在朴素贝叶斯公式中，

P

(

A

0

∣

R

1

)

P(\ A_0\ |\ R_1)

P( A0 ∣ R1) 等条件累乘的结果显然大于等于

P

(

A

0

B

0

C

0

D

0

E

0

∣

R

1

)

P(\ A_0\ B_0\ C_0\ D_0\ E_0\ |\ R_1)

P( A0 B0 C0 D0 E0 ∣ R1) ，这意味着变换后更不容易为0。
换一种说法，

P

(

A

0

∣

R

1

)

P(\ A_0\ |\ R_1)

P( A0 ∣ R1) 每个条件相较于

P

(

A

0

B

0

C

0

D

0

E

0

∣

R

1

)

P(\ A_0\ B_0\ C_0\ D_0\ E_0\ |\ R_1)

P( A0 B0 C0 D0 E0 ∣ R1) 的可能性是更高的，他们每个不等于0的概率都比

P

(

A

0

B

0

C

0

D

0

E

0

∣

R

1

)

P(\ A_0\ B_0\ C_0\ D_0\ E_0\ |\ R_1)

P( A0 B0 C0 D0 E0 ∣ R1) 大。
因此，在变换后，朴素贝叶斯公式更加稳定，在小样本数据中发挥更好。

为了模拟计算过程，我们回到 0-1 脱单数据集中：

在这里插入图片描述
然后对照着计算。

我们之前提过一嘴，这样的方法只是最简单的数量统计，面对连续型数据时，简单的数量统计势必会使算法陷入维度灾难中，此外简单的统计数量也不能体现样本数据的连续性。因此，我们需要一种方法处理连续型数据，当然

最低0.47元/天解锁文章

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
机器学习之朴素贝叶斯分类器原理详解、公式推导（手推）、面试问题、简单实例(1)

楼上的数据集不是0-1数据，不太适合说明问题，我们这里退化下交往意向数据集，将1-5的评分标记为0，6-10的评分标记为1，完成0-1交往意向数据集。P( A0 B0 C0 D0 E0) 为 0 的情况，毕竟总有一类人的条件在相亲市场中不受欢迎，但是因为这是在小样本数据中的结果，并不能真实代表这个概率，直接判定 0 显然不可靠。P( A0 B0 C0 D0 E0 ∣ R1) 的可能性是更高的，他们每个不等于0的概率都比。P( A0 B0 C0 D0 E0 ∣ R1) 大。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。