机器学习-贝叶斯公式

MilkyTea'Ou

已于 2022-03-09 18:02:35 修改

阅读量1.9k

点赞数

分类专栏：机器学习文章标签：机器学习概率论

于 2022-03-09 17:31:37 首次发布

本文链接：https://blog.csdn.net/micro_msdn/article/details/123382512

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

贝叶斯公式

学习机器学习和模式识别的人一定都听过贝叶斯公式(Bayes’ Theorem)：

P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B) = \frac{P(B|A)P(A)}{P(B)}P(A∣B)=
P(B)
P(B∣A)P(A)

【式1】

贝叶斯公式看起来很简单，无非是倒了倒条件概率和联合概率的公式。

把B展开，可以写成：

P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ∣ A ) P ( A ) + P ( B ∣ ∼ A ) P ( ∼ A ) P(A|B) = \frac{P(B|A)P(A)}{P(B|A)P(A) + P(B|\sim A)P(\sim A)}P(A∣B)=
P(B∣A)P(A)+P(B∣∼A)P(∼A)
P(B∣A)P(A)

【式2】（∼ A \sim A∼A表示"非A"）

这个式子就很有意思了。

想想这个情况。一辆汽车（或者电瓶车）的警报响了，你通常是什么反应？有小偷？撞车了？不。。你通常什么反应都没有。因为汽车警报响一响实在是太正常了！每天都要发生好多次。本来，汽车警报设置的功能是，出现了异常情况，需要人关注。然而，由于虚警实在是太多，人们渐渐不相信警报的功能了。

贝叶斯公式就是在描述，你有多大把握能相信一件证据？（how much you can trust the evidence）

我们假设响警报的目的就是想说汽车被砸了。把A计作“汽车被砸了”，B计作“警报响了”，带进贝叶斯公式里看。我们想求等式左边发生A ∣ B A|BA∣B的概率，这是在说警报响了，汽车也确实被砸了。汽车被砸**引起（trigger）**警报响，即B ∣ A B|AB∣A。但是，也有可能是汽车被小孩子皮球踢了一下、被行人碰了一下等其他原因（统统计作∼ A \sim A∼A），其他原因引起汽车警报响了，即B ∣ ∼ A B|\sim AB∣∼A。那么，现在突然听见警报响了，这时汽车已经被砸了的概率是多少呢（这即是说，警报响这个证据有了，多大把握能相信它确实是在报警说汽车被砸了）？想一想，应当这样来计算。用警报响起、汽车也被砸了这事件的数量，除以响警报事件的数量（这即【式1】）。进一步展开，即警报响起、汽车也被砸了的事件的数量，除以警报响起、汽车被砸了的事件数量加上警报响起、汽车没被砸的事件数量（这即【式2】）。

可能有点绕，请稍稍想一想。
可能有点绕，请稍稍想一想。

再思考【式2】。想让P ( A ∣ B ) = 1 P(A|B) = 1P(A∣B)=1，即警报响了，汽车一定被砸了，该怎么做呢？让$ P(B|\sim A)P(\sim A) = 0即可。很容易想清楚，假若让即可。很容易想清楚，假若让即可。很容易想清楚，假若让P(\sim A) = 0$，即杜绝了汽车被球踢、被行人碰到等等其他所有情况，那自然，警报响了，只剩下一种可能——汽车被砸了。这即是提高了响警报这个证据的说服力。

从这个角度总结贝叶斯公式：做判断的时候，要考虑所有的因素。老板骂你，不一定是你把什么工作搞砸了，可能只是他今天出门前和太太吵了一架。

再思考【式2】。观察【式2】右边的分子，P ( B ∣ A ) P(B|A)P(B∣A)为汽车被砸后响警报的概率。姑且仍为这是1吧。但是，若P ( A ) P(A)P(A)很小，即汽车被砸的概率本身就很小，则P ( B ∣ A ) P ( A ) P(B|A)P(A)P(B∣A)P(A)仍然很小，即【式2】右边分子仍然很小，$P(A|B) $ 还是大不起来。这里，P ( A ) P(A)P(A)即是常说的先验概率，如果A的先验概率很小，就算P ( B ∣ A ) P(B|A)P(B∣A)较大，可能A的后验概率P ( A ∣ B ) P(A|B)P(A∣B)还是不会大（假设P ( B ∣ ∼ A ) P ( ∼ A ) P(B|\sim A)P(\sim A)P(B∣∼A)P(∼A)不变的情况下）。

从这个角度思考贝叶斯公式：一个本来就难以发生的事情，就算出现某个证据和他强烈相关，也要谨慎。证据很可能来自别的虽然不是很相关，但发生概率较高的事情。发现刚才写的代码编译报错，可是我今天状态特别好，这语言我也很熟悉，犯错的概率很低。因此觉得是编译器出错了。 ————别，还是先再检查下自己的代码吧。

看来生活中碰到贝叶斯概率的场景到处都是；
——————————————
版权声明：本文为CSDN博主「nebulaf91」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/u011508640/article/details/72815981

MilkyTea'Ou

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习-贝叶斯公式

贝叶斯公式学习机器学习和模式识别的人一定都听过贝叶斯公式(Bayes’ Theorem)：P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B) = \frac{P(B|A)P(A)}{P(B)}P(A∣B)=P(B)P(B∣A)P(A)【式1】贝叶斯公式看起来很简单，无非是倒了倒条件概率和联合概率的公式。把B展开，可以写成：P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ∣ A ) P ( A ) + P ( B
复制链接

扫一扫

专栏目录