Monty Hall Problem（三门问题）的数学证明、理解及python实现

一舰之长

已于 2023-02-17 16:57:47 修改

阅读量1.8k

点赞数 2

分类专栏：蒙提霍尔问题蒙特卡洛模拟文章标签： python 概率论

于 2023-02-14 11:49:01 首次发布

本文链接：https://blog.csdn.net/weixin_44285505/article/details/128973181

版权

Monty Hall Problem（三门问题）是一个著名的统计学谜题，涉及概率和决策。本文通过数学建模和Python模拟解释了为何改变选择是最佳策略。在参赛者选择一扇门后，主持人Monty揭示另一扇藏有山羊的门，这时改变选择能提高赢得汽车的概率。文章详细介绍了数学模型的构建，包括事件概率计算和条件概率分析，证明了改变选择的最优性。

摘要由CSDN通过智能技术生成

Monty Hall Problem（三门问题）的数学证明、理解及python实现

Mounty Hall Problem(三门问题)
数学建模与求解
从信息论角度的理解
从博弈思维（直觉）的理解
仿真模拟

Mounty Hall Problem(三门问题)

Monty Hall Problem（蒙提霍尔问题，亦称“三门问题”），出自美国电视游戏节目Let’s Make a Deal，由一位名为Monty Hall的主持人主持，因而得名。这个问题后来被广泛用于统计学的教学案例，是统计学中非常经典的“脑筋急转弯”。
在该问题中，参赛者会面对三扇一模一样，但藏有不同道具的门，其中一扇门的背后放着一辆汽车，另外两扇门后各是一只山羊。每件道具被放在任意一扇门后的概率是完全相同的。参赛者打开任何一扇门，都会得到门后的东西。因此，如果玩家打开了藏有汽车的门，那么他将获得一辆汽车，而打开其他任何一扇门，只能获得一只山羊。而主持人Monty，不能揭露汽车在哪扇门后，但他会在参赛者选中一扇门后，并在其打开这扇门前，帮他排除剩下两扇门中藏有山羊的一扇门。这时，参赛者需要做出选择：是继续不忘初心，坚持己见？还是放弃当初的选择，打开剩下的最后那扇门？
一种常见的思路是，Monty帮你排除了一扇藏有山羊的门，那么剩下的两扇门里一扇有山羊，一扇有汽车。因此，不论是“不忘初心”也好，还是“改弦易辙”也罢，能选中汽车的概率都是 $\frac{1}{2}$ 。所以根本不存在什么最优选择。
但事实果真如此吗？事实上，参赛者放弃原有选择而重新选择剩下的最后那扇门才是最优解。
那么如何用数学的语言去证明这一结论？上述的一般思路又存在什么问题呢？

数学建模与求解

问题分析与模型建立

首先，将上述问题中的各个关键点翻译成数学语言：
参赛者(Player, P)面临三扇门，编号为A，B和C，参赛者选择门A对应事件{P=A}, 同理，还存在事件{P=B}和{P=C}。于是，有样本空间 $\Omega_P={\{P=A, P=B, P=C\}}$ 。由于参赛者没有被透露更多能够影响他做出选择的信息，因此参赛者对门做出的选择完全基于其自身的感觉和喜好。但我们并不清楚参赛者做出选择的概率分布。因此，我们只能假设 $P(P=A)=P_A, P(P=B)=P_B, P(P=C)=P_C$ ，当然， $P_A+P_B+P_C=1$ 。
道具在三扇门后的分布组合由样本空间 $\Omega_D={\{(A=V, B=G, C=G);}$
${(A=G,B=V,C=G);(A=G,B=G,C=V)}\}$ 定义。其中，V代表汽车，G代表山羊。
显然， $P (A = V) = P (A = V, B = G, C = G) =$ $\frac{1}{3}$ ;
$P (A = G) = P (A = G, B = V, C = G) + P (A = G, B = G, C = V) =$ $\frac{2}{3}$ 。
同理， ${P(B=V)=\frac{1}{3}}$ , ${P(B=G)=\frac{2}{3}}$ ；以及， ${P(C=V)=\frac{1}{3}}$ , ${P(C=G)=\frac{2}{3}}$
由于参赛者既不知道门后道具的分配，也不能影响门后道具的分配，那么参赛者选某扇门和这扇门后是什么道具之间没有必然联系。因此， $\Omega_P$ 中的任一基本事件都与 $\Omega_D$ 中的任一基本事件相互独立。即 $P(P=D_1|D_2=G)=P(P=D_1)$ 或者 $P(D_1=G|P=D_2)=P(D_1=G)$ ，D1和D2指代的门可以相同也可以不同。
主持人Monty Hall (M)会在参赛者做出选择后剩下的门里，打开一扇藏有山羊的门。这句话暗含几个含义：一是，Monty Hall打开的门只可能藏有山羊而不可能藏有汽车；二是，Mounty Hall只能在参赛选手选剩下的门里开门，也就是Monty Hall打开的门不可能跟参赛选手选择的门相同。于是，把上述语言翻译成概率论的语言，得到： ${\{M=D\}\cap\{D=G\}=\{M=D\}}$ ， ${\{M=D\}\cap\{D=V\}=\emptyset}$ ， ${\{M=D\}\cap\{P=D\}=\emptyset}$ 。其中，D可以是门A，B，C中的任意一扇门。但有一种特殊情况，那就是如果参赛者一开始就猜中了汽车所在的门，那么Monty不得不在剩下的两扇藏有山羊的门中挑选一扇。当然，我们仍然不知道Monty是如何“随机”挑选的（即，不清楚他做决策的概率分布）。严谨起见，我们假设Monty在剩下的两扇门中，选择编号更靠后（按A,B,C的顺序, 靠后的门统称为L，靠前的门统称为F）的门概率为 $P(M=L|P=D,D=V)=P_{M} \in(0,1)$ ，那么选择另一扇门的概率就是 $P(M=F|P=D,D=V)=1-P_{M}$ 。以门A藏有汽车且被参赛者选择为例，那么Monty选择门C的概率为 $P(M=C|P=A,A=V)=P_{M}$ ，选择门B的概率就是 $P(M=B|P=A,A=V)=1-P_{M}$ 。
整理上述条件，得到：