[算法]朴素贝叶斯的理解

朴素贝叶斯的基本理解
方法:

  • ①基本概念:贝叶斯应该算是一种思想,用新产生的事件,来不断纠正对于某个事件的概率估计。使得结果不断正确化。用公式表达就是ABBAAB,即P(A|B)=P(B|A)P(A)/p(B)这种形式。意思是在新事件B发生的前提下,A事件发生的概率,进行了修正,其修正系数就是右侧P(B|A)/P(B),比如开车途中快要到一个路口,原来我认为前面一辆车在这个路口右转的概率只有30%。即这里的P(A),结果这个车子突然打了右转的灯,这个就是事件B,一个车子要右转的条件下,打右转灯的概率是很高的,因为现在有严格执法,所以这里的P(B|A)=1,即100%,而一辆车打右转灯的概率,除了要有转,平时应该不高,估计总概率也就20%,P(B)就是0.2,代入右侧公式,现在我就能有一个判断,前面这辆打了右转灯,并且要右转的概率是0.3*(1/0.2)=1.5概率不会超过1,就是基本是1了,所以我纠正了自己的想法。这个就是贝叶斯思想。
  • ②朴素贝叶斯分类器:其实上面我们就做了一个分类动作(将车辆归为了“要右转”,“不要右转"两类中的一类),可见,人自己就是一个天然的分类器,每天潜意识的在做着各种分类。但是上面的例子中,我们所有的右侧计算都是估计的,凭借经验估计,这点是需要改进的,的确可以估计,但是估计也要有客观依据(通常的做法就是用频率代替概率),上面的例子,我们完全可以蹲在路口,看每一辆在路口的车,记录以下2个内容,是否打右转灯,是否右转,第一个其实就是我们平时分类问题的属性特征值,这里简化了,属性只需要一个,右边则是标签,即最终的分类结果。比如经过几个月记录了1000个数据,那么公式里面的P(B|A)-右转前提下打右转灯的概率,P(A)-右转概率,P(B)-打右转灯的概率,都可以从记录数据中计算,当然我们计算出的只是频率,但是数据量足够大了,近似作为概率的估计,这样等式右侧其实就形成了一个概率值,即计算出了左侧分类的结果:即前车打右转灯的时候,归类为右转车辆的概率。
  • ③进一步拓展:前面只是一个特征值,正常情况肯定会有很多的特征值,一样的,只要特征之间是相互独立的,比如除了打右转灯这个特征,还可以记录车速是否降低到xxx之下这个特征,这两个就是相互独立的特征(注意B是特征,A是分类结果),B1 B2,相互乘起来就行。这样就可以和其他分类器一样,处理分类问题,只不过在朴素贝叶斯算法中,训练过程其实就是计算等式右侧内容的过程而已。

总结:
贝叶斯分类器,是一种比较贴近于现实的人的分类方式。通常需要两个方面的信息:一个是基础的预估值,即贝叶斯概率分类的基础的部分,另一个是记录的特征值(由于是贝叶斯概率,所以这里的特征值记录通常是一些频率值的记录的部分)通过后续发生的事件来逐渐修正之前的事件的概率估计,从而完成最终的概率估计的纠正,这个就是贝叶斯的概率分布(其实平时我们的神经网络最后一层用了softmax来进行激活作为一种参考的维度,能够在一定程度上,提供比较好的分类结果,但从准确率角度来看,其实还是神经网络,深度学习更胜一筹。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值