朴素贝叶斯原理

1.朴素贝叶斯的使用条件

朴素贝叶斯方法假设条件概率分布是相互独立的,这个假设会使每个属性独立的对分类结果产生影响

因此,根据独立性有,$p(x_1,x_2,...,x_n|C) = p(x_1|C)p(x_2|C)...p(x_n|C),其中x_n是特征,C是分类的类别$

2.贝叶斯公式

由于朴素贝叶斯假设属性之间相互独立,所以贝叶斯公式可以写成如下形式

$p(C|\mathbf x) = {p(C)  p(x_1,x_2,...,x_n | C)\over p(x_1,x_2,...,x_n)} = {p(C) \over p(x_1,x_2,...,x_n)} p(x_1 | C) p(x_2 | C)  \ldots p(x_n | C)$

 3.贝叶斯分类器

1)训练数据集的n个特征为$x = (x_1,x_2,\ldots,x_n)$

2)假设C代表分类的类别

分别计算概率$p(x_1 | C), p(x_2 | C),  \ldots ,p(x_n | C)$

计算$p(C)$

由于$p(x_1,x_2,...,x_n)$对于所有的C类来说都是一样的,所以可以把这一项看做常数,因此

$p(C|\mathbf x) \propto p(C) p(x_1 | C) p(x_2 | C)  \ldots p(x_n | C)$

其中 $\propto$表示成比例关系,如y = kx可以写成$y \propto x$

3)故要想使$p(C|\mathbf x)$最大,即使$ p(C) p(x_1 | C) p(x_2 | C)  \ldots p(x_n | C)$最大

$\hat C = \arg\max p(C) p(x_1 | C) p(x_2 | C)  \ldots p(x_n | C) $

4.例子

判断$\mathbf x = ${Outlook = Sunny,Temperature = Cool,Humidty = High,Wind = Strong}能不能打网球

Outlook{Sunny、Overcast、Rain}

Temperature{Hot、Mild、Cool}

Humidty{High、Normal}

Wind{Weak、Strong}

1)$x = (x_1,x_2,x_3,x_4)$,其中$x_1$是Outlook = Sunny、$x_2$是Temperature = Cool、$x_3$是Humidty = High、$x_4$是Wind = Strong

2)为了更直观的计算概率$p(x_1 | C), p(x_2 | C),p(x_3 | C) ,p(x_4 | C)$,将上表整理成如下形式,其中C是分类的类别Play = yes 或 Play = No

 

$p(x_1 | Play = yes) = {2\over 9}$    $p(x_1 | Play = No) = {3\over 5}$

$p(x_2 | Play = yes) = {3\over 9}$    $p(x_2 | Play = No) = {1\over 5}$

$p(x_3 | Play = yes) = {3\over 9}$    $p(x_3 | Play = No) = {4\over 5}$

$p(x_4 | Play = yes) = {3\over 9}$    $p(x_4 | Play = No) = {3\over 5}$

$p(Play = yes) = {9\over 14}$      $p(Play = yes) = {5\over 14}$

3) $p(Play = yes) p(x_1 | Play = yes)p(x_2 | Play = yes)p(x_3 | Play = yes)p(x_4 | Play = yes) = 0.005$

$p(Play = No) p(x_1 | Play = No)p(x_2 | Play = No)p(x_3 | Play = No)p(x_4 | Play = No) = 0.02$

故$\mathbf x = ${Outlook = Sunny,Temperature = Cool,Humidty = High,Wind = Strong}不能打网球

转载于:https://www.cnblogs.com/vshen999/p/10301095.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值