【数据挖掘】第四章 分类与预测 4.4 朴素贝叶斯分类方法

本文介绍了朴素贝叶斯分类方法,它基于贝叶斯公式,假设样本属性相互独立。主要内容包括理解独立和条件独立的概念,回顾贝叶斯定理,通过癌症筛查和头痛流感案例展示其应用,并详细解释朴素贝叶斯分类的步骤和算法流程,最后以购买电脑案例说明分类预测过程。
摘要由CSDN通过智能技术生成

这次课我们来学习朴素贝叶斯方法,朴素贝叶斯方法和我们上次课讲到的内容信息商来构造决策树模型的id3方法类似,不过它是运用贝叶斯公式来构造分类和预测方法的。

朴素贝叶斯方法基于贝叶斯公式提出,其中的朴素是指假设样本中个属性之间是相互独立和条件独立的。本次课的主要内容分为以下四点,首先对独立和条件独立进行说明,其次重温贝叶斯定理,第三是重点内容讲解朴素贝叶斯分类预测方法,最后给出一个实例对算法进行说明。

概率中的相互独立概念我们已经很清楚了,即 a 。: Ab 事件的联合概率等于 a 的概率乘以 b 的概率,条件独立是 g 事件条件下 ab 的联合概率,等于 g 事件条件下 a 概率乘以 b 事件条件下的 p 概率。我们给出两个实例来说明独立和条件独立的概念。第一个例子是肺癌与性别的联系案例。假设性别为男性的条件下,肺癌的发生概率为6.5‰,而性别为女性的条件下,肺癌的发生概率为4.8‰,

此时思考一个问题,性别为 male 或者 female ,这个性别属性与肺癌 c 属性是否条件独立?此时研究时假定吸烟是肺癌的唯一诱因,那么我们只要计算事件 s smoking 和 m 条件下的 cancel 守联合概率是否等于 smoking 条件下的概率即可。第二个实例是颜色的方块图,一共49个网格,红色和蓝色混合是紫色,紫色渲染的网格有六个,红色渲染的网格是16个,蓝色渲染的网格是18个。可以看出 prob 不等于 pr 乘以 pb

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能lab

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值