机器学习之朴素贝叶斯分类器原理详解、公式推导(手推)、面试问题、简单实例(1)

本文详细介绍了朴素贝叶斯分类器的原理,通过实例展示了如何利用Python进行实现,包括数据集创建、模型训练与评估。同时,探讨了在处理连续型数据时的挑战及解决方案,并提供了防止下溢的策略。最后,文章还讨论了面试中可能遇到的相关问题,以加深读者对朴素贝叶斯的理解。
摘要由CSDN通过智能技术生成

先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7

深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年最新软件测试全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上软件测试知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

如果你需要这些资料,可以添加V获取:vip1024b (备注软件测试)
img

正文

E

0

R

1

)

P(\ A_0\ B_0\ C_0\ D_0\ E_0\ |\ R_1)

P( A0​ B0​ C0​ D0​ E0​ ∣ R1​) 为 0 和

P

(

A

0

B

0

C

0

D

0

E

0

)

P(\ A_0\ B_0\ C_0\ D_0\ E_0)

P( A0​ B0​ C0​ D0​ E0​) 为 0 的情况,毕竟总有一类人的条件在相亲市场中不受欢迎,但是因为这是在小样本数据中的结果,并不能真实代表这个概率,直接判定 0 显然不可靠。
在朴素贝叶斯公式中,

P

(

A

0

R

1

)

P(\ A_0\ |\ R_1)

P( A0​ ∣ R1​) 等条件累乘的结果显然大于等于

P

(

A

0

B

0

C

0

D

0

E

0

R

1

)

P(\ A_0\ B_0\ C_0\ D_0\ E_0\ |\ R_1)

P( A0​ B0​ C0​ D0​ E0​ ∣ R1​) ,这意味着变换后更不容易为0。
换一种说法,

P

(

A

0

R

1

)

P(\ A_0\ |\ R_1)

P( A0​ ∣ R1​) 每个条件相较于

P

(

A

0

B

0

C

0

D

0

E

0

R

1

)

P(\ A_0\ B_0\ C_0\ D_0\ E_0\ |\ R_1)

P( A0​ B0​ C0​ D0​ E0​ ∣ R1​) 的可能性是更高的,他们每个不等于0的概率都比

P

(

A

0

B

0

C

0

D

0

E

0

R

1

)

P(\ A_0\ B_0\ C_0\ D_0\ E_0\ |\ R_1)

P( A0​ B0​ C0​ D0​ E0​ ∣ R1​) 大。
因此,在变换后,朴素贝叶斯公式更加稳定,在小样本数据中发挥更好。

为了模拟计算过程,我们回到 0-1 脱单数据集中:

在这里插入图片描述
然后对照着计算。

我们之前提过一嘴,这样的方法只是最简单的数量统计,面对连续型数据时,简单的数量统计势必会使算法陷入维度灾难中,此外简单的统计数量也不能体现样本数据的连续性。因此,我们需要一种方法处理连续型数据,当然

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值