《机器学习实战》--朴素贝叶斯

朴素贝叶斯是基于概率的分类器。

条件概率

A,B表示两个独立的事件,概率P(A|B)表示事件B发生的情况下,事件A发生的概率。即:

P(A|B)=P(AB)/P(B)

在应用中,常常知道P(A|B),来求P(B|A);即比较容易知道一种情况的概率,以此来请另一种情况的概率:

P(A|B)=P(B|A)P(A)/P(B)

这就是贝叶斯公式

朴素贝叶斯分类

上面的贝叶斯公式只是最简单的原理。在分类时常常有多个特征,假设有特征 F1 , F2 , …, Fn (特征之间相互独立),C表示类别,贝叶斯公式可以为:

P(C|F1,F2,...,Fn)=P(C)P(F1,F2,...,Fn|C)P(F1,F2,...,Fn)

公式表示,包含特征 F1 , F2 , …, Fn 的元素是C类别的概率。分母是固定的,展开分子项
P(C)P(F1,F2,...,Fn|C)=P(C)P(F1,C)P(F2,...,Fn|C,F1)=P(C)P(F1,|C)P(F2|C,F1)P(F3|C,F1,F2)...P(Fn|C,F1,F2,...Fn1)

因为特征F之间相互独立,朴素意味着“条件独立”
P(Fi|C,Fj)=P(Fi|C)

上面的公式可以简化为
P(C)P(F1,F2,...,Fn|C)=P(C)P(F1|C)P(F2,|C)...P(Fn|C)=P(C)inP(Fi|C)

朴素贝叶斯分类是要计算特征 F1 , F2 , …, Fn 的元素是其他类别的概率,找出最大类别的概率,即

classify(f1,...,fn)=argmaxP(C=c)P(Fi=fi|C=C)

例子

性别身高(英尺)体重(磅)脚的尺寸(英寸)
618012
5.92 (5’11”)19011
5.58 (5’7”)17012
5.92 (5’11”)16510
51006
5.5 (5’6”)1508
5.42(5’5”)130
5.75 (5’9”)1509

身高、体重、脚的大小都为连续变量。处理连续变量,常常假设其符合高斯分布。例如对于属性x,可以计算器均值和方差,假设变量x的均值为 μ ,方差为 σ2 。那么

P(x=v|X)=12πσ2e(vμ)22σ2

经过计算,可以得到

性别均值(身高)方差(身高)均值(体重)方差(体重)均值(脚的尺寸)方差(脚的尺寸)
男性5.8553.5033e-02176.251.2292e+0211.259.1667e-01
女性5.41759.7225e-02132.55.5833e+027.51.6667e+00

给出一组参数:

性别身高(英尺)体重(磅)脚的尺寸(英尺)
sample61308

求sample性别?在求解时,比较这组参数为男的概率和为女的概率,取较大者即可。

P(男|身高,体重,脚的尺寸)= P(男)P(身高|男)P(体重|男)P(脚的尺寸|男)/P(身高,体重,脚的尺寸)
P(女|身高,体重,脚的尺寸)= P(女)P(身高|女)P(体重|女)P(脚的尺寸|女)/P(身高,体重,脚的尺寸)

在这组参数中,比较分母即可,假设P(男) = P(女) = 0.5

参考

朴素贝叶斯分类器

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值