朴素贝叶斯算法

注:其实不是原创,可也不是转载和翻译,是整理的邹博《机器学习》视频配套ppt里关于朴素贝叶斯的算法推导。怎么就没有个其它选项,不选还不行?

数学基本公式

条件概率公式:

P(A|B)=P(AB)P(B) P ( A | B ) = P ( A B ) P ( B )

全概率公式:
P(A)=iP(A|Bi)P(Bi) P ( A ) = ∑ i P ( A | B i ) P ( B i )

贝叶斯公式:
P(Bi|A)=P(A|Bi)P(Bi)jP(A|Bj)P(Bj) P ( B i | A ) = P ( A | B i ) P ( B i ) ∑ j P ( A | B j ) P ( B j )

朴素贝叶斯算法 Naive Bayes

1、问题
  对于给定的特征向量 X(x1,x2,...,xn) X ( x 1 , x 2 , . . . , x n ) ,类别 y y 的概率可以根据贝叶斯公式得到:
  

P(y|x1,x2,...,xn)=P(y)P(x1,x2,...,xn|y)P(x1,x2,...,xn)

  求给定新的样本 xn+1 x n + 1 时,其类别 y^ y ^ 是什么。
2、推导
  (1)特征独立性假设:一个特征出现的概率,与其它特征(条件)独立,每个特征同等重要。
  (2)由上面假设推出:
  

P(xi|y,x1,x2,...,xi1,xi+1,...,xn)=P(xi|y) P ( x i | y , x 1 , x 2 , . . . , x i − 1 , x i + 1 , . . . , x n ) = P ( x i | y )

  则有:
  
P(y|x1,x2,...,xn)=P(y)P(x1,x2,...,xn|y)P(x1,x2,...,xn)=P(y)ni=1P(xi|y)P(x1,x2,...,xn) P ( y | x 1 , x 2 , . . . , x n ) = P ( y ) P ( x 1 , x 2 , . . . , x n | y ) P ( x 1 , x 2 , . . . , x n ) = P ( y ) ∏ i = 1 n P ( x i | y ) P ( x 1 , x 2 , . . . , x n )

  (3)又,在给定样本集的前提下, P(x1,x2,...,xn) P ( x 1 , x 2 , . . . , x n ) 是常数,则有
  
P(y|x1,x2,...,xn)P(y)i=1nP(xi|y) P ( y | x 1 , x 2 , . . . , x n ) ∝ P ( y ) ∏ i = 1 n P ( x i | y )

  (4)从而
  
y^=argmaxyP(y)i=1nP(xi|y) y ^ = arg ⁡ max y ⁡ P ( y ) ∏ i = 1 n P ( x i | y )

高斯朴素贝叶斯Gaussian Naive Bayes

假定特征服从高斯分布,即有:

P(xi|y)=12πσyexp((xiμy)22σ2y) P ( x i | y ) = 1 2 π σ y e x p ( − ( x i − μ y ) 2 2 σ y 2 )

参数使用MLE估计即可:
假定训练集为T
μ=1nxϵTxi μ = 1 n ∑ x ϵ T x i

σ2=1nxϵT(xiμ)2 σ 2 = 1 n ∑ x ϵ T ( x i − μ ) 2

P(xi|y) P ( x i | y ) 代入朴素贝叶斯公式求出 y^ y ^

多项式朴素贝叶斯 Multinomial Naive Bayes

假定特征服从多项式分布,对每个类别 y y ,参数为

θy=(θy1,θy2,...,θyn)

其中 n n 为特征的数目,P(xi|y)的概率为 θyi θ y i
参数 θy θ y 使用MLE估计的结果为:

θyi=Nyi+αNy+αn,    α0 θ y i = N y i + α N y + α n ,         α ⩾ 0

假定训练集为T,属于y类别的样本集为 Ty T y ,则有:
Nyi=xϵTyxi N y i = ∑ x ϵ T y x i (属于 y y 类别的样本中xi出现多少次)
Ny=Ti=1Nyi N y = ∑ i = 1 T N y i (属于 y y 类别的样本个数)
其中:
  α=1称为Laplace平滑,避免 θyi θ y i 出现0/0的算法异常;
   α<1 α < 1 称为Lidstone平滑
P(xi|y) P ( x i | y ) 代入朴素贝叶斯公式求出 y^ y ^

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值