从线性模型角度理解朴素贝叶斯

本文从线性模型的角度深入探讨朴素贝叶斯分类器,包括伯努利朴素贝叶斯和多项式朴素贝叶斯,揭示它们的log-linear特性,并对比朴素贝叶斯与逻辑回归的区别。
摘要由CSDN通过智能技术生成

以前看朴素贝叶斯的时候只知道它属于生成模型,这几天回顾的时候发现理解的不够深,在这里总结一下,如果有不对的地方,欢迎指正。

0. 生成模型与判别模型

  1. 判别模型:判别模型关心的是给定输入 x x ,应该预测怎样的输出 y ,它通常是直接学习条件概率分布 p(y|x) p ( y | x ) ,例如逻辑回归(Logistic Regression)。
  2. 生成模型:通常对 p(y) p ( y ) (class priors)与 p(x|y) p ( x | y ) (likelihood)建模,根据贝叶斯公式得到条件概率分布 p(y|x) p ( y | x )

p(y|x)=p(x,y)p(x)=p(y)p(x|y)p(x)(1) (1) p ( y | x ) = p ( x , y ) p ( x ) = p ( y ) p ( x | y ) p ( x )

  如果我们使用(1)式对样本 x x 进行分类时,则是将其分到具有最大输出概率 p ( y | x ) 的一类:

argmaxyp(y|x)=argmaxyp(x|y)p(y)p(x)=argmaxyp(x|y)p(y)(2) (2) arg ⁡ max y ⁡ p ( y | x ) = arg ⁡ max y ⁡ p ( x | y ) p ( y ) p ( x ) = arg ⁡ max y ⁡ p ( x | y ) p ( y )

  其中,分母 p(x) p ( x ) 是与最大化 y y 无关的常数项,可以略去。朴素贝叶斯分类器就是通过这种方式进行分类。

1. 朴素贝叶斯分类器

  对于具有n维特征的样本 x = ( x 1 , x 2 , . . . , x n ) ,其可能的输出有 K K { C 1 , C 2 , . . . , C k } ,使用朴素贝叶斯预测给定当前样本 x x 下其输出类别 Ck C k 的概率,根据(1)式可以写为:

p(Ck|x1,x2,...,xn)=p(x1,x2,...,xn,Ck)p(x)=p(Ck)p(x1,x2,...,xn|Ck)p(x)(3) (3) p ( C k | x 1 , x 2 , . . . , x n ) = p ( x 1 , x 2 , . . . , x n , C k ) p ( x ) = p ( C k ) p ( x 1 , x 2 , . . . , x n | C k ) p ( x )

对(3)式中分子的第二项,有:
p(x1,x2,...,xn|Ck)=p(x
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值