7.3 朴素贝叶斯分类器

朴素:属性条件独立性假设。即假设每个属性独立地对分类结果发生影响。

朴素贝叶斯分类器重写了书中的式(7.8)为:
P ( c ∣ x ) = P ( c ) P ( x ∣ c ) P ( x ) = P ( c ) P ( x ) ∏ i = 1 d P ( x i ∣ c ) P(c|x) = \frac{P(c)P(x|c)}{P(x)} = \frac{P(c)}{P(x)}\prod_{i=1}^d P(x_i|c) P(cx)=P(x)P(c)P(xc)=P(x)P(c)i=1dP(xic)
其中, ∏ i = 1 d P ( x i ∣ c ) = P ( x 1 ∣ c ) ∗ P ( x 2 ∣ c ) ∗ ⋯ ∗ P ( x n ∣ c ) \prod_{i=1}^d P(x_i|c) = P(x_1|c)* P(x_2|c)*\dots * P(x_n|c) i=1dP(xic)=P(x1c)P(x2c)P(xnc)
d为属性数目, x i x_i xi x x x在第i个属性上的取值。

基于书中式(7.6),即 h ∗ ( x ) = arg ⁡ max ⁡ c ϵ y P ( c ∣ x ) h^*(x) = \underset{c\epsilon{y}}{\arg\max} P(c|x) h(x)=cϵyargmaxP(cx) ,基于该式,将式(7.8)代入,(由于P(x)对所有类别来说是相同的,可以省略),可以得到下面:
h n b ( x ) = arg ⁡ max ⁡ c ϵ y P ( c ) ∏ i = 1 d P ( x i ∣ c ) h_{nb}(x) = \underset{c\epsilon{y}}{\arg\max} P(c)\prod_{i=1}^d P(x_i|c) hnb(x)=cϵyargmaxP(c)i=1dP(xic)
这就是朴素贝叶斯分类器的表达式。
即给定x的情况下,贝叶斯分类器最可能出现的情况c,P(x)省略。

  • D c D_c Dc 表示训练集D中第c类样本组成的集合,若有充足的独立同分布样本,则可容易地估计出类先验概率:
    P ( c ) = ∣ D c ∣ ∣ D ∣ P(c) = \frac{|D_c|}{|D|} P(c)=DDc
    (1)对离散属性而言,令 D c , x i D_{c,x_i} Dc,xi表示 D c D_c Dc中在第i 个属性上取值为 x i x_i xi 的样本组成的集合,则条件概率 P ( x i ∣ c ) P(x_i | c) P(xic)可估计为: ( 这 里 不 是 绝 对 值 , 而 表 示 集 合 大 小 ) \red{(这里不是绝对值,而表示集合大小)} ()
    P ( x i ∣ c ) = ∣ D c , x i ∣ ∣ D c ∣ P(x_i|c) = \frac{|D_{c,x_i}|}{|D_c|} P(xic)=DcDc,xi
    (2)对连续属性可考虑概率密度函数,假定 p ( x i ∣ c )   N ( μ c , i , σ c , i 2 ) p(x_i|c)~N(\mu_{c,i},\sigma^2_{c,i}) p(xic) N(μc,i,σc,i2),其中 μ c , i 和 σ c , i 2 \mu_{c,i}和\sigma^2_{c,i} μc,iσc,i2分别是第c类样本在第i个属性上取值的均值和方差,则有:
    P ( x i ∣ c ) = 1 2 π σ c , i e x p ( − ( x i − μ c , i ) 2 2 σ c , i 2 ) P(x_i|c) = \frac{1}{\sqrt{2\pi}\sigma_{c,i}} exp(- \frac{(x_i-\mu_{c,i})^2}{2\sigma^2_{c,i}}) P(xic)=2π σc,i1exp(2σc,i2(xiμc,i)2)
以下针对西瓜书P151中的例子进行验算:

可参考这篇文章
在这里插入图片描述
利用朴素贝叶斯算法训练出一个分类器,以判断一个具有特征{色泽=青绿,根蒂=蜷缩,敲声=浊响,纹理=清晰,脐部=凹陷,触感=硬滑,密度=0.697,含糖率=0.460}的测试样例(“测1”)瓜( x t e s t x_{test} xtest )是否为好瓜。

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值