分类算法——朴素贝叶斯

本文介绍了朴素贝叶斯分类算法的原理和应用。通过训练集数据,使用贝叶斯公式计算条件概率,确定数据元组应归属的类别。算法基于类条件独立性和贝叶斯定理,即使在属性间存在关联的场景下,仍能获得较好的分类效果。文章还讨论了连续属性处理、零概率问题的解决方案,并指出朴素贝叶斯分类器在某些场景下的准确性可与其他复杂算法相媲美。
摘要由CSDN通过智能技术生成

分类算法
使用训练集(数据元组+对应类标号),选用某种分类算法进行监督学习,得到一个分类器;再使用和训练集没有重合的检验集来使用分类器分类,检验分类器的准确率。如果准确率可以接受,那这个分类器就可以用啦。

朴素贝叶斯分类法
用途:给定一个元组,可以计算出这个元组最应该被分到哪个类。使用条件概率来度量“应该程度”
原理:利用贝叶斯公式算出以给定元组矢量值为条件,在训练集上计算出现类i的概率,能使这个条件概率取最大值的类i就是该元组应该被分到的类。
基于类条件独立性的假定+贝叶斯定理,因此名叫朴素+贝叶斯。
类条件独立性:假定一个数据的各个属性对分类标号的影响是相互独立的。(其实也就是每个属性的取值之间没有相关性。和统计学中的条件概率要求随机事件之间相互独立是一回事)
贝叶斯定理公式(也就是条件概率公式):P(A|B)=P(B|A)*P(A)/P(B)
大白话版本:朴素贝叶斯分类法,其实是提供打了标签的历史数据(这里就是训练集),然后对一条未打标签的新数据,利用条件概率算算这条历史数据中这条新数据的取值条件下应该被打上每种标签的概率,哪个概率最高就打哪个。

一些脑中预定义的感知:
1、每个元组都是一个向量,提供了这一条数据在不同属性维度上的取值。
2、具体有多少种分类是已知的:就看

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值