【机器学习算法】朴素贝叶斯法(NaiveBayes)

朴素贝叶斯法对条件概率分布作了条件独立性假设,条件独立假设等于是说用于分类的特征在类确定的条件下都是条件独立的。
这一假设使朴素贝叶斯变得简单。

1.学习与分类

朴素贝叶斯法实际上是学习到生成数据的机制,所以属于生成模型。

2.参数估计

2.1 极大似然估计

K 为:K为c的所有可能情况的数目
Sj S j 为:特征的可能出现的所有情况
可以应用极大似然估计法估计相应的概率,先验概率 P(Y=Ck) P ( Y = C k ) PX(j)=x(j)|Y=ck P ( X ( j ) = x ( j ) | Y = c k ) ,可以应用极大似然估计法估计相应的概率,先验概率的极大似然估计是:

P(Y=ck)=Ni=1I(yi=ck)N,k=1,2,...,K P ( Y = c k ) = ∑ i = 1 N I ( y i = c k ) N , k = 1 , 2 , . . . , K

设第j个特征 x(j) x ( j ) 可能取值的集合为 aj1,aj2,ajsj a j 1 , a j 2 , a j s j ,条件概率 P(X(j)=aj,i|Y=ck) P ( X ( j ) = a j , i | Y = c k ) 的极大似然估计是:
P(X(j)=ajl|Y=ck)=Ni=1I(x(j)i=ajl,yj=ck)Ni=1I(yi=ck),j=1,2,...,n;l=1,2,...,Sjk=1,2,...,K P ( X ( j ) = a j l | Y = c k ) = ∑ i = 1 N I ( x i ( j ) = a j l , y j = c k ) ∑ i = 1 N I ( y i = c k ) , j = 1 , 2 , . . . , n ; l = 1 , 2 , . . . , S j ; k = 1 , 2 , . . . , K

ajl a j l 是第j个特征可能取得第I个值;I为指示函数(sigmoid函数)类型相同的

2.3 学习与分类算法

1)计算先验概率以及条件概率
2)对于给定的实例 x=(x(1)x(1)x(1))T x = ( x ( 1 ) , x ( 1 ) , x ( 1 ) ) T ,计算
3)确定实例的类:
y=argmaxP(Y=ck)nj=1P(X(j)=x(j)|Y=ck) y = a r g m a x P ( Y = c k ) ∏ j = 1 n P ( X ( j ) = x ( j ) | Y = c k )
这里写图片描述

2.2 贝叶斯估计

用极大似然估计可能会出现所要估的概率值为0的情况,这时会影响到后验概率的计算结果,使分类产生偏差,解决这一问题的方法是采用贝叶斯估计,具体地,条件概率的贝叶斯估计是

Pλ(X(j)=ajl|Y=ck)=Ni=1I(yi=ck)+Sjλ P λ ( X ( j ) = a j l | Y = c k ) = ∑ i = 1 N ∑ I ( y i = c k ) + S j λ

式中\lambda >= 0,等价于在随机变量各个取值的频数上赋予一个正数 λ>0 λ > 0 ,当 λ=0 λ = 0 时就是极大似然估计。
常取 λ=1 λ = 1 ,称为拉普拉斯平滑,显然,对任何l = 1,2,…,S_j,k = 1,2,…,K,有:
Pλ(X(j)=ajl|Y=ck)>0 P λ ( X ( j ) = a j l | Y = c k ) > 0

l=1sjP(X(j)=ajl|Y=ck)=1 ∑ l = 1 s j P ( X ( j ) = a j l | Y = c k ) = 1

同样,先验概率的贝叶斯估计是:
Pλ(Y=ck)=Ni=1I(yi=ck)+λN+Kλ P λ ( Y = c k ) = ∑ i = 1 N I ( y i = c k ) + λ N + K λ

例子:
按照拉普拉斯平滑估计概率,即取 λ=1 λ = 1
这里写图片描述

总结:

1.朴素贝叶斯法是典型的生成学习方法,生成方法是由训练数据学习联合概率分布P(X,Y),然后求得后验概率分布P(Y|X)。
具体来说,利用训练数据学习P(X|Y)和P(Y)的估计,得到联合概率分布:

P(X,Y)=P(Y)P(X|Y) P ( X , Y ) = P ( Y ) P ( X | Y )

概率估计方法可以是极大似然估计或者贝叶斯估计
2.基本假设:条件独立性

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值