[算法]朴素贝叶斯的理解

最新推荐文章于 2021-12-04 20:29:02 发布

XiaoH0_0

最新推荐文章于 2021-12-04 20:29:02 发布

阅读量284

点赞数

分类专栏：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/XiaoH0_0/article/details/100715254

版权

算法专栏收录该内容

13 篇文章 0 订阅

订阅专栏

朴素贝叶斯的基本理解
方法：

①基本概念：贝叶斯应该算是一种思想，用新产生的事件，来不断纠正对于某个事件的概率估计。使得结果不断正确化。用公式表达就是ABBAAB，即P(A|B)=P(B|A)P(A)/p(B)这种形式。意思是在新事件B发生的前提下，A事件发生的概率，进行了修正，其修正系数就是右侧P(B|A)/P(B)，比如开车途中快要到一个路口，原来我认为前面一辆车在这个路口右转的概率只有30%。即这里的P(A),结果这个车子突然打了右转的灯，这个就是事件B，一个车子要右转的条件下，打右转灯的概率是很高的，因为现在有严格执法，所以这里的P(B|A)=1,即100%，而一辆车打右转灯的概率，除了要有转，平时应该不高，估计总概率也就20%，P(B)就是0.2，代入右侧公式，现在我就能有一个判断，前面这辆打了右转灯，并且要右转的概率是0.3*(1/0.2)=1.5概率不会超过1，就是基本是1了，所以我纠正了自己的想法。这个就是贝叶斯思想。
②朴素贝叶斯分类器：其实上面我们就做了一个分类动作（将车辆归为了“要右转”，“不要右转"两类中的一类），可见，人自己就是一个天然的分类器，每天潜意识的在做着各种分类。但是上面的例子中，我们所有的右侧计算都是估计的，凭借经验估计，这点是需要改进的，的确可以估计，但是估计也要有客观依据（通常的做法就是用频率代替概率），上面的例子，我们完全可以蹲在路口，看每一辆在路口的车，记录以下2个内容，是否打右转灯，是否右转，第一个其实就是我们平时分类问题的属性特征值，这里简化了，属性只需要一个，右边则是标签，即最终的分类结果。比如经过几个月记录了1000个数据，那么公式里面的P(B|A)-右转前提下打右转灯的概率,P(A)-右转概率，P(B)-打右转灯的概率，都可以从记录数据中计算，当然我们计算出的只是频率，但是数据量足够大了，近似作为概率的估计，这样等式右侧其实就形成了一个概率值，即计算出了左侧分类的结果：即前车打右转灯的时候，归类为右转车辆的概率。
③进一步拓展：前面只是一个特征值，正常情况肯定会有很多的特征值，一样的，只要特征之间是相互独立的，比如除了打右转灯这个特征，还可以记录车速是否降低到xxx之下这个特征，这两个就是相互独立的特征（注意B是特征，A是分类结果），B1 B2，相互乘起来就行。这样就可以和其他分类器一样，处理分类问题，只不过在朴素贝叶斯算法中，训练过程其实就是计算等式右侧内容的过程而已。

总结：
贝叶斯分类器，是一种比较贴近于现实的人的分类方式。通常需要两个方面的信息：一个是基础的预估值，即贝叶斯概率分类的基础的部分，另一个是记录的特征值（由于是贝叶斯概率，所以这里的特征值记录通常是一些频率值的记录的部分）通过后续发生的事件来逐渐修正之前的事件的概率估计，从而完成最终的概率估计的纠正，这个就是贝叶斯的概率分布（其实平时我们的神经网络最后一层用了softmax来进行激活作为一种参考的维度，能够在一定程度上，提供比较好的分类结果，但从准确率角度来看，其实还是神经网络，深度学习更胜一筹。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。