机器学习实战笔记4(朴素贝叶斯)

本文介绍了朴素贝叶斯分类器的概念、公式推导和在文档分类中的应用,包括Python代码实现过滤网站恶意留言和垃圾邮件。朴素贝叶斯基于属性间条件独立的假设,通过计算各类别概率最大化进行决策。文章还讨论了处理概率为0和下溢出的问题,以及在词集和词袋模型中的应用。
摘要由CSDN通过智能技术生成

前面介绍的kNN和决策树都给出了“该数据实例属于哪一类”这类问题的明确答案,而有时候的分类并不能给出明确的答案,本节讲解使用概率论进行分类的方法。

1:简单概念描述

概念比较简单,这里我摘抄自百度百科,很容易理解。

朴素贝叶斯模型(NaiveBayesian classification))

----

Vmap=arg max P( Vj | a1,a2...an)

Vj属于V集合

其中Vmap是给定一个example,得到的最可能的目标值.

其中a1...an是这个example里面的属性.

这里面,Vmap目标值,就是后面计算得出的概率最大的一个.所以用max来表示

----

贝叶斯公式应用到 P(Vj | a1,a2...an).

可得到Vmap= arg max P(a1,a2...an | Vj ) P( Vj ) / P (a1,a2...an)

又因为朴素贝叶斯分类器默认a1...an他们互相独立的.

所以P(a1,a2...an)对于结果没有用处

评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值