使用朴素贝叶斯算法实现中文邮件分类_朴素贝叶斯(转载自Morgan)

本文介绍了朴素贝叶斯分类算法的基础,包括贝叶斯定理和特征条件独立假设,并通过垃圾邮件分类的例子展示了如何应用该算法。通过计算后验概率,朴素贝叶斯算法能有效进行文本分类,尽管其假设较为简化,但在实际问题中仍展现出高效性和实用性。
摘要由CSDN通过智能技术生成

什么是朴素贝叶斯

要搞懂朴素贝叶斯分类,首先需要了解什么是贝叶斯定理和特征条件独立假设,朴素贝叶斯算法就是基于这两个来实现的分类方法。

贝叶斯定理

贝叶斯定理通俗点讲就是求在事件 B 已经发生的前提下,事件 A 发生的概率,记为 P(A|B),被称为 A 的后验概率,也称为条件概率
其基本公式为:

60b19fc3b4ee6acb21f30108ca7d37e0.png


P(A)就叫做先验概率边缘概率
P(B|A) 就是在 事件A 发生情况下的 B 事件的概率分布,也是条件概率

公式记不住怎么办,A 和 B 太容易混淆了。有办法,我们来推导一遍,首先 A 和 B 同时发生的概率被成为联合概率,表示为 P(AB)、P(A,B)、P(A ∩ B)。学过概率我们应该都知道,条件概率公式为:

bd8fea1b93251a965d991babe44ab36e.png


若由两个事件推广到无穷多个事件,条件概率公式可扩展为:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值