三门问题扩展到N门问题的解法探讨

前言

  三门问题也称为蒙提霍尔问题、蒙特霍问题或蒙提霍尔悖论,出自美国的电视游戏节目Let's make a deal.来自 Craig F. Whitaker 于1990年寄给《展示杂志》(Parade Magazine)玛丽莲·沃斯·莎凡特(Marilyn vos Savant)专栏的信件: “假设你正在参加一个游戏节目,你被要求在三扇门中选择一扇:其中一扇后面有一辆车;其余两扇后面则是山羊。你选择了一道门,假设是一号门,然后知道门后面有什么的主持人,开启了另一扇后面有山羊的门,假设是三号门。他然后问你:“你想选择二号门吗?”转换你的选择对你来说是一种优势吗?”

一、一般的解法是什么?

网上有很多解答用的是贝叶斯模型,但这种解法的困难在于:如何设定模型?这是一个“语文”问题。这里面最简单或者说最容易理解的方法是这样:
  假定任何情况下,选手都选择“不换”的策略,意味着主持人的选择对其不起作用,也就是说主持人的选择没有增加任何信息量,故其中奖的概率就是1/3;
  假定任何情况下,选手都选择“更换”的策略,那么在“三门”问题中,选手第一次的选择就注定了其会不会中奖,后面选择的结果都是确定的(主要因为主持人拥有“上帝之眼”,他是知道奖品在哪扇门的,所以他一定会选择没有奖品的门)。比如我们假定奖品在A号门,则如果一开始选A号门,意味着这种选择一定不会中奖,而如果一开始选了B号或者C号门,由于主持人只有唯一选择,主持人选完之后,选手也只有唯一选择,故这种情境下,选手一定会中奖。总结一句话就是,一开始选错的话,换了就一定会赢,一开始选对了的话,换了就一定会输。一开始选错的概率是2/3,一开始选对的概率是1/3,所以换了之后赢的概率大。

二、换个形式来解三门和四门问题

这个问题如果这么来分析,也就只能到这里了。我的意思是,如果是有N扇门呢?再扩展一下,如果有N扇门,且主持人选了M次呢?(M《=N-2)。这种情形下,个人认为使用贝叶斯模型也可能会因为条件的复杂而犯错。我们考虑用一个一般的思路来推导。
首先还是看最简单的三门问题,我们仍假定有A、B、C三个门,奖品在A门后(其实在哪个门后都是等价的)。因为无论如何选,选手和主持人加起来都是选3次,相当于做一个的全排列,我们用1、2、3分别代表三次选择(1和3为选手者选,2为主持人选)。这6次选择的概率结果如下:
A B C 概率公式 概率结果
情境1 1 2 3 1/3×1/2×1 16.7%
情境2 1 3 2 1/3×1/2×1 16.7%
情境3 2 1 3 1/3×0 0.0%
情境4 2 3 1 1/3×0 0.0%
情境5 3 1 2 1/3×1×1 33.3%
情境6 3 2 1 1/3×1×1 33.3%

 这里需要说明的是:
 如果完全随机(包括选手和主持人),则由于世界的对称性,六种情境都是等概率的,故每种概率都是1/6。
 正是因为主持人是“上帝之眼”,他的选择2非随机,故某些情景所要分配的概率是不一样的,所以会比完全随机要复杂一些。
 好在总共只有3次选择,所以我们可以使用“乘法规则”来逐个试算,并依此来寻找规律。
 比如:第一轮选择,作为选手完全随机,所以六种情境的第一个概率都是1/3,第二轮是“上帝之眼”的主持人做的,此时他一定不会选择后面有奖品的A门。所以情境3和4的第二个概率等于0,情境1,和2的第二个概率等于1/2。在情境1、2、5和6中,因为第三轮都只有唯一选择,故概率为1。根据乘法规则可以算出上述每种情境的概率。上述情境下,只有3在A门的情境5和6可以中奖,二者相加就得到了“更换”策略下的中奖概率。
 扩展:假定有A、B、C和D四扇门,依然按照选手–主持人–选手选3次,选手采取无论怎样均“更换”的策略,结论又如何呢?如果完全随机,则共有中情境(详情如下)。
  A B C D 概率公式 概率结果
情境1 1 2 3 1/4×1/3×1/2 4.2%
情境2 1 2 3 1/4×1/3×1/2 4.2%
情境3 1 3 2 1/4×1/3×1/2 4.2%
情境4 1 3 2 1/4×1/3×1/2 4.2%
情境5 1 2 3 1/4×1/3×1/2 4.2%
情境6 1 3 2 1/4×1/3×1/2 4.2%
情境7 2 1 3 1/4×0 0.0%
情境8 2 1 3 1/4×0 0.0%
情境9 2 3 1 1/4×0 0.0%
情境10 2 3 1 1/4×0 0.0%
情境11 2 1 3 1/4×0 0.0%
情境12 2 3 1 1/4×0 0.0%
情境13 3 1 2 1/4×1/2×1/2 6.3%
情境14 3 1 2 1/4×1/2×1/2 6.3%
情境15 3 2 1 1/41/21/2 6.3%
情境16 3 2 1 1/4×1/2×1/2 6.3%
情境17 3 1 2 1/4×1/2×1/2 6.3%
情境18 3 2 1 1/4×1/2×1/2 6.3%
情境19 1 2 3 1/4×1/2×1/2 6.3%
情境20 1 3 2 1/4×1/2×1/2 6.3%
情境21 2 1 3 1/4×1/2×1/2 6.3%
情境22 2 3 1 1/4×1/2×1/2 6.3%
情境23 3 2 1 1/4×1/2×1/2 6.3%
情境24 3 1 2 1/4×1/2×1/2 6.3%
 我们还是按照选择的顺序,一轮一轮来分析。第一轮选择,选手完全随机,概率肯定是1/4,这一点24种情境都是无差别的。第二轮出现差异,由于“上帝之眼”的主持人不可能选择A门,故情境7-12的第二轮概率均为0,这里面与三门的不同之处是,如果第一轮选手选了A门,则第二轮主持人实际有3种选择,则情境1-6的第二轮概率均为1/3,;如果第一轮选手未选A门,则主持人只有2种选择,则情境13-24的第二轮概率均为1/2。选完第二轮之后,第三轮选手均只有2种选择,故第三轮任何一种情境的概率都是1/2。以上所有情境中,只有3在A的情形是中奖的。这些情形加起来的概率就是3/8。

三、推广到N门

根据以上的推理模式,我们尝试扩展到N门,3种选择(主持人选1次)的情形。要计算“更换”策略下的最终中奖的概率,可以只考虑3在A门的情形的计算(换句话说即1必不在A门)。Anyway,第一轮选择的概率只可能是1/N,第二轮选择是主持人做的,他不能选择A和第一轮选手已选的门,所以此时只有N-2个门可以选,故其选择任何一个可选门的概率为1/(N-2);第三轮选手是随机选择,此时其有N-2个门(排除掉自己第一轮选的和第二轮主持人选的)可选,故概率为1/(N-2)。故这种情形的单一最小颗粒度概率是。再看有多少种这种“最小颗粒度”概率呢?即在3固定在A门后,1和2在N-1扇门里有多少种排列呢,用排列公式即可得到:
在这里插入图片描述
 那么更换策略的中奖的概率就是就把这些单一最小颗粒度概率求和,即
在这里插入图片描述
 很容易证明(因为N-1>N-2),这个数总会大于1/N,即无论多少扇门,换总比不换好。

四、继续一般化到N门M次选择的情形

我们再尝试扩展到N个门,主持人选择了M次的情形。要计算“更换”策略下的最终中奖的概率。第一轮选择的概率依旧只可能是1/N,第二轮主持人的选择有N-2种,故其任何一种选择的概率是1/(N-2);第三轮选择主持人的选择有N-3种,故其任何一种选择的概率是1/(N-3)…以此类推,其最后一次选择的概率是1/[N-(M+1)],选手最后一轮选的概率是1/[N-(M+1)](其中第一次是选手选的,其余M次是主持人选的)。单一最小颗粒度概率是:
在这里插入图片描述
这种概率等价的最小颗粒度有几个呢?用排列公式得到:
在这里插入图片描述
上述二式相乘得到:
在这里插入图片描述
(s.t. N>=M+2)

  • 9
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值