朋友圈发了不少关于贝叶斯公式的豪言壮语了,终于也算到了周末,应该简单总结一下了。本文不是专业的数学论文,跟原来一样,主要还是以科普为目的,最终让我们认识到利用贝叶斯公式的思维方式,可以带来什么不同。
先给出贝叶斯公式的通常写法(即教科书写法):
P(A|B)=P(A)×P(B|A)P(B)
为了理解它,需要理解很多的概念,最后过了一段时间可能还是记不住…
然而,如果我们将贝叶斯公式换一个写法,其中代表的含义以及如何使用它就令人恍然大悟了。
曾经的解释
曾经很多人对贝叶斯公式给出的解释是,先根据经验拍一个先验概率,然后再逐步根据实际观测的结果对先验概率进行微调。写法如下所示:
P(A|B)=P(A)×P(B|A)P(B)
其中,可以将 P(B|A)P(B) 设为 u ,这样就成了:
如果 u>1 ,则增加事件发生的概率,如果 u<1 ,则降低相应的概率。
那么
u
代表什么含义呢?其实
值得品味的是,这就是我们人类的思维方式!我们对待任何事物,几乎都是按照这种方式进行的,首先凭直觉对事物有个大概的印象,然后根据后续发生的一系列事件对这个初始印象进行修正,虽然最终我们可能依然是在盲人摸象,但至少是在不断逼近真理。
以上是贝叶斯公式蕴含的生活哲学。
因果对称解释
我不知道之前有没有这种解释,我是没有看到。这个解释是我在下班的班车上突然想到的,觉得不错,就即时总结下来,写成这篇文章。
贝叶斯公式的两边同时乘以 P(B) ,得到以下的等式:
P(A|B)×P(B)=P(B|A)×P(A)
嗯,就是它!
我先来解释一下 P(A|B)×P(B) 的含义。
两个概率相乘,并不总要理解成两个事件同时发生的概率,其实从其字面意义理解更简单。这里先从全概率公式说起。先看下全概率公式:
P(B)=∑i=1nP(B|Ai)P(Ai)
公式本身很简单,关键是如何来理解它。其实,关键就是如何理解每一个乘积
P(B|Ai)P(Ai)
,它代表什么。我这里给出一个解释:
全概率
P(B)
其实是一个数学期望,它表示事件B发生的概率的期望,假设引起事件B的前因有
i
个,分别是
请注意,上述解释中,
我们先来看式子的左边
P(A|B)×P(B)
,其中
P(A|B)
代表假定事件B发生的前提下,事件A发生的概率,乘以
P(B)
表示上述假定确实发生的概率,这里
B
是因,
再看右边
P(B|A)×P(A)
,不用再重复上段的解释,最终,
A
是因,
这意味着事件的发生关于时间是对称的!如果你相信数学,那么我们的宇宙关于时间的演化就是对称的!没有什么因果区分,如果
A
发生于
这很有意思!单凭这个式子,即使是上帝也无法确定时间流逝的方向:
这到底是宿命论,还是因果论的崩塌!
只是把贝叶斯公式做了一个最简单的移项处理,竟然可以得到这么一个结论,我本来是相信自由意志的,但是这个式子明显表示因果和果因根本就是一一对应的,这是注定的,难道是数学错了?除非概率论本身的根基就是错的,不然这一定是一个真理,就算没有贝叶斯,相信随便一个人也会很快得出相应的结论:
我们从最基本的开始:
P(A|B)×P(B)=P(A⋂B)
P(B|A)×P(A)=P(A⋂B)
所以就有:
P(A|B)×P(B)=P(B|A)×P(A)
这难道不是显然的吗?即便没有贝叶斯,这也是显然的。然而这式子本身并不重要,重要的是这表达了一种全新的解答问题的方式,和本文第一种解释完全契合。
执果溯因这种方法论意义上的指示不是形而上的,而是物质的,是客观的真理!
几乎所有人的一生都是不断事件的结果寻找原因的过程,我记得我女儿小小小时候学说话的时候,从来都是不断模仿而不管其什么含义,其它的行为也是不断试错,从周围的人的反馈来获取信息,然后就知道了自己这么做是对还是错,是该加强还是该削减。
抛开个人不谈,几万年甚至几十万年前的原始野人,在没有任何可供现成学习的经验的前提下,也是靠不断的运用贝叶斯公式来逐渐逼近事物真实的原因的,当原因猜到他们认为八九不离十正确的时候,他们便可以运用这个判断去指导一些自由的行为了,这正是文明最终产生的根本源动力,搞了半天原来就是一个贝叶斯公式!
也许现在你应该明白为什么AI领域的机器学习中贝叶斯这个名字如此普遍存在了吧,难道原始野人的进化过程不就跟机器学习的过程很类似吗?
…
下一篇准备简单聊聊对数,其实人脑除了是一个贝叶斯公式的计算器之外,还是一部对数转换器。