【数据挖掘·总复习】第五章||贝叶斯算法||知识点整理||自食用

41 篇文章 1 订阅
9 篇文章 2 订阅

step by step.

目录

1. 关于概率

 2. 贝叶斯

(1) 贝叶斯公式 

(2)例题:

3.  朴素贝叶斯分类模型算法

(1) 算法流程

(2)例题计算

(3) 贝叶斯算法特点

4. 贝叶斯信念网

    (1)两个主要成分

 (2)举例

不过贝叶斯网络的画图怎么搞啊!!


要看具体章节复习汇总请见👇

【scau数据挖掘·总复习】博客汇总||第一章~第九章+密度聚类_半段烟y9的博客-CSDN博客step by step.目录第二章第三章第四章第五章第六章第七章第八章、第九章、补充知识第二章【数据挖掘·总复习】第二章-数据预处理||详细整理||知识点+例题||考点有_半段烟y9的博客-CSDN博客详细复习资料https://blog.csdn.net/weixin_51159944/article/details/120444098第三章【数据挖掘·总复习】第三章-关联规则挖掘||Apriori||详细整理||知识点+例题||考点有_半段烟y9的博https://blog.csdn.net/weixin_51159944/article/details/122111501

自己辛苦总结的,点个赞鼓励一下啦~


贝叶斯方法是主观的。


1. 关于概率

一些简单的关于条件概率的知识。温故一下。

👇

注:

  P(A)通常在试验之前已知,因此习惯上称为先验概率

  P(B|A)反映了A发生之后,事件B发生的可能性大小,通常称之为后验概率。

 2. 贝叶斯

(1) 贝叶斯公式 

贝叶斯公式

👇

(2)例题:

 上例题!

考虑一个医疗诊断问题,有两种可能的假设:

1)病人有癌症。

2)病人无癌症。

样本数据来自某化验测试,它也有两种可能的结果:阳性和阴性。

假设我们已经有先验知识:

1)在所有人口中只有0.8%的人患癌症。

2)此外,化验测试对有癌症的患者有98%的可能返回阳性结果,对无癌症患者有97%的可能返回阴性结果。

假设现在有一个新病人,化验测试结果为阳性,是否将病人断定为有癌症呢?


解:

上面的数据可以用以下概率式子表示:

P(cancer)=0.008

P(无cancer)=1- P(cancer)= 1- 0.008=0.992

P(阳性|cancer)=0.98

P(阴性|cancer)=1-P(阳性|cancer)=1-0.98 =0.02

P(阴性|无cancer)=0.97

P(阳性|无cancer)=1-P(阴性|无cancer)=1-0.97=0.03

 

按我的理解:👇

3.  朴素贝叶斯分类模型算法

(1) 算法流程

(1)对训练样本数据集和测试样本数据集进行离散化处理缺失值处理

(2)扫描训练样本数据集,分别统计训练集中类别Ci的个数di和属于类别Ci的样本中属性Ak取值为xi的实例样本个数,构成统计表;

(3)计算先验概率条件概率,构成概率表;

(4)构建分类模型                   

(5)扫描待分类的样本数据集,调用已得到的统计表、概率表以及构建好的分类准则,得出分类结果。

(2)例题计算

eg1。

朴素贝叶斯分类器来解决这样一个分类问题:根据天气状况来判断某天是否适合于打网球。

给定表5-1所示的14个训练实例,其中每一天由属性Outlook, Temperature, Humidity, Wind来表征,类属性为Play Tennis。

有一个测试实例x:

<Outlook=sunny, Temperature=cool, Humidity=high, Wind=strong>,

问这一天是否适合于打网球。

day

outlook

temperature

humidity

wind

Play tennis

1

sunny

hot

high

weak

no

2

sunny

hot

high

strong

no

3

overcast

hot

high

weak

yes

4

rain

mild

high

weak

yes

5

rain

cool

normal

weak

yes

6

rain

cool

normal

strong

no

7

overcast

cool

normal

strong

yes

8

sunny

mild

high

weak

no

9

sunny

cool

normal

weak

yes

10

rain

mild

normal

weak

yes

11

sunny

mild

normal

strong

yes

12

overcast

mild

high

strong

yes

13

overcast

hot

normal

weak

yes

14

rain

mild

high

strong

no


 (no的概率更大)

eg2.

有一个测试实例x:

(age <=30,Income = medium,Student = yes,Credit rating= Fair)

问这一实例是否会买电脑,我们的任务是要判断给定的测试实例是属于yes还是no?


yes: 0.02821

no:  0.002

∴ 买!

(3) 贝叶斯算法特点

        优点逻辑简单、易于实现、开销小,算法稳定;

        缺点:属性间接独立。

4. 贝叶斯信念网

    (1)两个主要成分

  (1)一个有向无环图(Directed  Acyclic Graph,DAG),表示变量之间的依赖关系。

  (2)一个概率表,把各结点和它的直接父结点关联起来。

 (2)举例

 ∴   

不过贝叶斯网络的画图怎么搞啊!!

机器学习:详解贝叶斯网络+例题分析_FRIGIDWINTER的博客-CSDN博客_贝叶斯网络例题详解贝叶斯方法1 贝叶斯方法的理解2 贝叶斯定理3 贝叶斯网络4 贝叶斯网络例题分析1 贝叶斯方法的理解首先给出一个概率和似然的对比实例:(Qa) 假设袋子内有NNN个白球,MMM个黑球,伸手进去摸一次,摸出黑球的概率是多大?(Qb) 假设袋子内黑白球比例未知,伸手进去摸若干次,观察取出的球的颜色来推测袋子内的黑白球比例。对于似然问题(Qb),前面说过,贝叶斯学派认为环境参数θ\thetaθ不定,是一个随机变量。贝叶斯方法就是贝叶斯学派思考问题的模式,定义如下:参数先验信息π(θ)+样本观测数据https://blog.csdn.net/FRIGIDWINTER/article/details/115404656

  • 5
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值