关于三道门背后奖励抉择问题(全解析)

昨天看了一个节目,关于三扇门猜奖问题。 

先说明一下猜奖流程:你的面前有三道门,其中一道门后面有一个奖励(钱),其他门后面没有奖励(企鹅),现在猜哪道门后面有奖励。很容易知道此时每道门都有三分之一的可能性有奖。

假如你选择1门。此时主持人打开2门,并告知2门后没有奖励。接下来,主持人询问是否更换你的猜测选项。

按照我看节目的思路,原本有三道门,各门得奖的概率为三分之一,开了一道门(2门),现在有两道门(1、3门),因为你仍然未知哪道门有奖,所以剩下的两道门(1、3门)得奖的概率对你来说应该是一半一半,各为二分之一。

 

但是随后,主持人说你的想法不对, 开了2门,此时3门的概率更大,更易获奖。

我感到疑惑,不是很相信主持人,所以写了一个简单的代码看看到底概率变没变。

#include <stdio.h>
#include <stdlib.h>

int win=0,lose=0,wins=0,loses=0;

int main()
{
	int circle;
	for(circle=0;circle<100000;circle++)
	{
		int award=0,choice=0;
		award=rand()%3+1;
		choice=rand()%3+1;
		//printf("%d,%d\n",award,choice);
		int observe=0;
		if(choice==award){
			do{
				observe=rand()%3+1;
			}while(observe==award);
		}
		else{
			for(observe=1;observe==choice||observe==award;observe++){;}
		}
		//printf("%d\n",observe);
		if(choice==award){
			win++;
		}
		else{
			lose++;
		}
		int choice2=1;
		for(;choice2==choice||choice2==observe;choice2++){
		}
		if(choice2==award){
			wins++;
		}
		else{
			loses++;
		}
	}
	printf("win=%d\n",win);
	printf("lose=%d\n",lose);
	printf("wins=%d\n",wins);
	printf("loses=%d\n",loses);
	return 0;
}	

简单的运行了下,循环了100000次,得到结果:

 win代表你第一次选择后,第二次选择坚持第一次的选择获奖的结果,wins表示第一次选择后,第二次选择你改变为选其他门后获奖的结果。可以直观的看到,坚持不变和改变选择获奖的概率刚好分别是1/3和2/3。

那么为什么会发生这样的情况?

在我写代码的过程中,我意识到了一个事,在主持人开门这个行为中,他并不是随机的,因为为了节目效果,他既不会打开你选的那道门,也不会打开一道背后有奖励的门,所以这里存在一个潜在的条件就是主持人知道哪道门后面有奖励。

那么,如果你第一次选1门,而真实情况是1门后面有奖,那主持人开第二道门的概率就是1/2。如果真实情况是第二道门有奖,那么主持人开第二道门的概率是0。而如果真实情况是第三道门有奖,那么主持人开第二道门的概率是1。由此可见,因为主持人行为受系统真实状态干扰,所以他的行为一定会影响第二次你选择门的概率。而且显而易见,这儿第三道门的概率一定是增大了的,但是到底增大了多少呢?

 

我考虑到用贝叶斯公式来证明。

第一次证明:

根据刚刚的思路,先假设我第一次选择1门,然后看主持人是否会开2门。可知:在我选择1门的情况下,每道门后面有奖的可能性都为1/3,而根据不同门后有奖的情况,主持人选择开第二道门的概率变化。

由贝叶斯公式得,主持人如果打开二门,我选择3门中奖的概率:

然后我得到了1/2,我惊了,不应该是2/3吗?

我又检查了一下到底哪儿没考虑到,我意识到主持人开门后,此时已经对门后的情况进行过观察,也就是说,2门后有奖的可能性已经降为0了。

所以,我重新画了一张说明图:

第二次证明:

因为实际上主持人打开二号门的行为对于三扇门后获奖的概率进行了改变,所以考虑到这一点,再通过贝叶斯公式进行计算:

得到了正确的概率。所以,第二次选择的时候,改变选择确实会增加你获得奖励的可能性。

 

扩展

我又进一步思考了一下,如果这个问题不再是三道门,而是n道门,其中主持人每次开一道门,每次你都有机会更换选项,总共主持人打开n-2道门,那么剩下的两道门谁有奖的概率大?

根据上面的阐述,很容易想明白,选择两道门中,你之前n-1次选择中选择过的次数更少的那道门。

 

最后我的感想,概率论有些时候还真是非常反直觉的,但是让人感觉很真实。

  • 7
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值