python三门问题_三门问题为什么不是二分之一?

关于贝叶斯推论最著名的当属蒙蒂霍尔问题了。这个悖论来源于美国的一个电视节目,主持人叫蒙蒂·霍尔,这就是该悖论名称的由来。

问题设定如下:

有A、B、C三个门,其中一个门后面有一辆轿车。你可以从中任选一个门,如果轿车在这个门后,你就可以将车作为奖品开回家。

当你做出选择之后,主持人会从剩下两个门中选择1个打开。假如你选中A门,随后主持人打开B门且发现门后没有轿车。然后,主持人问你:“再给你一次机会,你可以在A和C中再做一次选择”。

这时候,你会坚持之前的选择呢?还是改选C呢?

很多文献给出的标准答案:应该选择换门,也就是选择C门,因为轿车在C门后的可能性更大,概率为2/3。

是不是感觉有点费解?不要着急,这个问题的答案已经被争论几十年了,还曾引发过一场骚动,所以有这种错觉完全属于正常反应。

在问答这个问题前,我们先看一个悖论。

三囚犯问题:

张三、李四和王麻子是同一所监狱的死囚犯。新皇登基,天下大赦,要赦免一批死囚犯。所有人都知道张三、李四和王麻子这三个人当中将有1人被释放,另外两人被处死。张三想知道谁将会被释放,跟看守套近乎,无奈看守嘴太严,没有透露给他任何有用的消息。于是,他转而求其次对看守说:“大家都知道我们3人中将有1人被释放,另外两个人会被处死,这也不是什么秘密。那么,李四和王麻子两个人当中至少有1人将会被处死,即使你告诉我这两人中谁会被处死,对我来说也没什么益处。那么,能不能请你告诉我,究竟谁要被处死呢?”

看守一听,觉得有道理,告诉了张三“李四将要被处死”的消息。

当张三得到李四将要被处死的消息后兴奋不已。他认为,现在知道了李四将会被处死,那么他和王麻子两个人中将会有1人被释放,所以他将被释放的概率应该是1/2,而不是之前的1/3。

你认同张三的看法吗?

如果你认同的话,那问题来了。

在张三的软磨硬泡下,看守最终告诉张三:李四会被处死。那么,如果张三被告知,王麻子会被处死呢?

按照张三的逻辑,他被释放的概率同样会变为1/2。

那请问看守“告知”与“不告知”又有什么关系呢?

是不是越看越迷糊?那答案到底是什么呢?

正确答案是:张三被释放的概率不变,王麻子被释放的概率将提升至2/3。

我们对比一下“三囚犯问题”和“蒙蒂霍尔悖论”。

1.“张三、李四和王麻子”VS “A门、B门和C门”;

2.“主持人”VS“监狱看守”;

3.“有一囚犯将被释放”VS“有一个门后有轿车”;

4.“看守告知张三关于李四将被处死的消息”VS“打开B发现门后没有轿车”。

通过对比可以看出,“三囚犯问题”和“蒙蒂霍尔悖论”具有相同的结构,本质上完全相同,都是典型的贝叶斯概率问题。

而贝叶斯推论之所以在最初时不被正统概率理论所接受就是由于其主观性太强,我将其成为概率论的唯心主义。在贝叶斯推理中没有一个固定的概率值,它是随条件和信息的变化而变化的。即使是同一事件,在不同状态和不同人眼中,概率值也是不一样的。

听着是不是觉得有点不可思议?有点玄学的味道?

为了便于理解,我们先看一个例子。

比如说,在我手上有4张不同花色的老K(扑克),我随机抽出1张让同学A和B猜。在抽牌过程中,不小心让A看到这张牌的颜色但他没看到花型,请问同学A和B谁猜对的可能性高呢?

这个问题很直观,相信你的答案肯定是A。

因为在这个游戏中同学A知道这张牌的颜色(A获得了比B更多的信息),所以A猜对的概率为1/2;B什么也不知道,能猜对的概率自然只有1/4;而我是抽牌者,在抽牌的过程中我真真切切地看到了这张牌是“红桃K”,在我眼中只有“红桃K”一种可能性,所以我猜对的概率为1。

你看,同样一张牌让3个人猜就会有3种完全不同的可能结果,只是因为3个人所掌握的信息不同而已。这就是贝叶斯推论主要讨论的方向。

现在,我们回到著名的蒙蒂霍尔悖论。

蒙蒂霍尔问题之所以被争论了几十年,主要集中在两大观点,我们暂且将这两大阵营称为直觉派和概率派。

直觉派:在最初时,3个门后有轿车的概率都是1/3。当主持人打开B且发现轿车不在门后,此时只剩下A和C,所以轿车不在A就在C,其概率都为1/2。也就是说,当排除B门后,B的可能性被平均分配给A和C。

概率派:在最初时,3个门后有轿车的概率都相等,为1/3。因为A门已经被选定,所以当排除B后,A门的概率并不会发生变化,这时只剩下C门,因此C门的概率被提升至2/3。

很多文献都认同概率派的说法,并对此进行了如下解释:

选择者自身的概率不会发生变化,而非选择者那一方的概率会发生变化。

按照这个理由来思考,概率因获得信息而发生变化,其实并不是你选择的一方,而是你未选择的那一方。这里提到的“概率”本身就是主观性的概念,而基于传统科学依据的“正确答案”根本就不存在。这是因为,当选手做出选择时,它是不是头奖就已经是固定不变的事实了,后来发生变化的只是“你的主观推测值”。

下面,我们用主观概率方面的代表性理论——贝叶斯推理,来探讨这个问题。

对于参加节目的选手来说,在最开始时,3个门后有轿车的概率完全相等,都是1/3,将其进行矩形分布,如下图。(在整个过程中,主持人本身是知道轿车在哪个门后的,所以对于主持人来说,其中一个门后有轿车的概率为1,另外两个门的概率为0)

因为轿车在哪个门后都是有可能的,所以将轿车在不同门后时主持人的可选性进行再分布,如下图。当轿车在A门时,主持人可以在B或C种任选一个,其概率都为1/2,记作“A门开B”或“A门开C”;当轿车在B门时,主持人只能选择C,其概率为1;当轿车在C门时,主持人只能选择B,其概率为1。

在节目中,主持人打开了B且门后没有轿车,所以应当将开C门的可能性从样本分布中剔除,如下图虚线部分,并将其进行标准化处理(比例相加等于1,S表示各部分矩形的面积)。

P(A):P(C)=S(A门开B):S(C门开B)=1/3*1/2:1/3*1=1/6:1/3=1/3:2/3

由此可得,C门后有轿车的概率为2/3,A门后有轿车的概率为1/3,所以应该改选C门。

那么,直觉派错在哪了呢?

直觉派错在了将不对等的概率权当作了对等关系。对于选手和观众来说,每个门后有轿车的概率都是1/3;但是,对于主持人来说,轿车在哪个门后是完全确定的,其概率为1。这完全是两种不对等的概率权关系,并且在抽奖的过程中主持人进行了“暗箱”操作,有选择性地将后面没有轿车的B门打开。在此过程中,他将B的概率权分配给了C,最终导致了C的概率权得到提升。

在什么情况下,A和C门后有轿车的概率才会相等呢?

假如节目组担心主持人在知道了轿车在哪个门后,可能在抽奖过程中不经意间将“秘密”泄露给选手。所以节目组制作了一张手卡给主持人,并要求主持人必须遵照手卡规则进行主持。规则如下:当轿车在A门后,开B门;当在B门后开C门;当在C门后开B门。

这样一来,主持人手里的选择权就被节目组收回了,每个门被打开的可能被平均分配了,都是1/3。

在节目中,主持人打开的是B且门后没有轿车,所以应该将开C门的可能性从样本中剔除,再将其进行标准化处理。

P(A):P(C)=S(A门开B):S(C门开B)=1/3*1:1/3*1=1/2:1/2

所以,在这种情况下,选手换不换门,最终赢得大奖的概率都是1/2。

还有一种情况会导致A和C门后有轿车的概率相等。

那就是,在整个抽奖过程中,主持人对轿车的位置一无所知。

如果节目组为了制造更自然的节目效果,让主持人在整个抽奖过程中对轿车情况一无所知。当选手选定A后,主持人在不知道轿车位置的情况下,随机选择了B。这时,主持人完全没有操作可能性的能力,也就无从分配B的概率权。当剔除错误答案B时,A和C的概率权将被自然分配,都变为1/2。

下来,用一个更为直观的方法对该问题进行解答。

因为A已被选手选定,所以主持人不能对A进行操作。这时,我们可以在按钮A上套一个玻璃罩①。而剩下的两个按钮B和C则成为主持人的备选项,将其当做整体套上另一个玻璃罩②。

那么,玻璃罩①的概率为1/3,玻璃罩②的概率就为2/3。当按下B发现门后没有轿车时,B门就被排除,该玻璃罩下只剩下按钮C,而该玻璃罩的概率为2/3,也就意味着按钮C的概率是2/3。

我们将蒙蒂霍尔悖论继续延展如下(主要是为了便于大家理解)。

延展一:

假如说,在这个电视节目中只有两个门呢?

那么两个门后有轿车的概率自然就都是1/2。当选手选定了A之后,主持人别无选择只能打开B。如果B门后有轿车, B门的概率变为1,A门概率降至0;如果B门后没有轿车,B门的概率变为0,A门的概率提升为1。

延展二:

如果在该节目中再增加一个门,将其改为4个门。那么,轿车在每个门后的概率都为1/4。当选手选定了A后,主持人打开B且发现门后没有轿车,那么C和D的概率将会得到提升,各为3/8。如果主持人继续打开C且门后空空如也,那么,D门的概率将会被提升至3/4。在整个过程中,A门的概率将不发生变化。

延展三:

那么,我们继续将选项(门)扩大,会是什么样的结果呢?

假如,现有一幅扑克,将其洗乱。正面朝下,从54张中摸大王,你从中挑出1张,然后荷官将剩余牌中去除掉52张,然后说那52张扑克中没有大王,这时候问你是否愿意将手中的牌和这张剩余的牌进行更换?

我相信,大家都会选择更换手中的牌。

延展四:

假如选手和观众都是微表情专家,能通过主持人细微动作判断其做选择时是否犹疑。

当主持人打开B门时,在B和C之间犹豫不决且被发现,那么轿车在C门的概率就变成0,A的概率则由1/3提升至1。因为主持人的犹豫暴露了“B门和C门都是备选项”这个秘密,也就意味着B和C后面都没有轿车,那么轿车必然在A门后。

延展五:

当主持人在打开B门的过程中毫无犹疑且被观察到,那么轿车在C门的概率就由1/3提升至1,A的概率降为0。因为当主持人毫不犹豫地打开B时,意味着他没有别的选择,即轿车定然在C门后。

你看,对于不懂概率的人,他中大奖的概率只有1/3;而对于懂概率的人,他中大奖的概率将成倍增加,甚至可以100%中奖。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值