机器学习基础:朴素贝叶斯

目录

1. 贝叶斯

2. 朴素贝叶斯分类器

2.1 样本T的组成

2.2 《朴素》贝叶斯

2.3 概率平滑——代替0

2.4 缺失值

2.5 朴素贝叶斯总结


1. 贝叶斯

贝叶斯公式

P(H|x)= \frac{P(x|H)P(H)}{P(x)}

这里的H可以认为是在分类任务中的某个类,所以P(H|x)可以表示在给出x的条件下,样本被判为第C类的概率,这个概率也是我们称为的后验概率。


贝叶斯公式的实例

当你周一去一家商店,你发现所有的灯都是off的,你会做什么推断?

先验概率:

P(H)=P(open)=0.95

即,通过统计数据,这家店开着的概率是95%

先验概率和后验概率可以这么理解:

P(H)P(H|x)相比,一个H是预先知道的,所以是先验的;一个是H需要在x的条件下算出来的,所以是后验的。

条件概率:

P(off|open)=0.01,当店铺开张的时候,灯灭的概率为0.01

P(off|closed)=0.85,当店铺关闭的时候,灯灭的概率为0.85

求后验概率P(open|off)

P(open|off) = \frac{P(off|open)P(open)}{P(off)}

P(off)=P(off,open) + P(off,closed)

= P(off|open)P(open)+P(off|closed)P(closed)

P(open|off) = \frac{P(off|open)P(open)}{P(off|open)P(open)+P(off|closed)P(closed)}

P(open|off) = \frac{0.01 * 0.95}{0.01 * 0.95 + 0.85 * (1-0.95)}=0.183

贝叶斯公式允许我们计算P(H|x)P(x|H)已知或者可以估算的时候。

2. 朴素贝叶斯分类器

已知,对于联合概率有:

P(C,X)=P(C|X)P(X)=P(X|C)P(C)

分类器的任务

我们现在的任务是:将样本Tinstance)进行分类,c_j \in C,我们需要依次求出这个样本T对于每一类c_j的概率,然后选出其中最大的那一个作为最终的预测类别。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值