第7-2课:垃圾邮件过滤与贝叶斯分类算法

本文介绍了贝叶斯分类算法在垃圾邮件过滤中的应用。通过贝叶斯定理,理解条件概率和多个条件下的概率计算。文章详细阐述了贝叶斯分类器的原理、步骤,包括样本数据模型、分类器模型的建立以及词汇表的获取。通过实例展示了如何训练分类器,并应用分类器进行垃圾邮件和正常邮件的识别。最后,讨论了贝叶斯分类器的局限性及其在实际问题中的应用。
摘要由CSDN通过智能技术生成

分类算法有很多种理论,比如决策树理论、K-最近邻法(KNN)理论、朴素贝叶斯理论、神经网络理论等,每种理论都有对应的分类算法。贝叶斯分类算法是众多分类算法中的一种,确切地说是一类,因为这类算法都是以贝叶斯定理为理论基础,所以被统称为贝叶斯分类。这一课我们将介绍贝叶斯分类算法,并用贝叶斯分类算法做一个简单的文本分类器,演示区分垃圾邮件和正常邮件的过滤器原理。

贝叶斯定理

贝叶斯(Thomas Bayes)是个英国牧师,为了证明上帝的存在,他发明了概率统计学原理。这可不是什么讽刺与幽默,历史上很多科学的发现,都是一些神职人员在研究神学过程中的“副产品”,比如被誉为现代遗传学之父的孟德尔(Gregor Johann Mendel)就是一个修道院的神父,他的豌豆实验想必大家都知道。

玩贝叶斯分类算法之前,先要了解一下贝叶斯定理,该定理其实是一个与概率有关的推理,这里就简单介绍一下贝叶斯定理。高能预警:前方有公式,不过放心,贝叶斯定理真的很简单

概率和条件概率

概率论中常用 P(A) 表示

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

吹泡泡的小猫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值