通过三门问题解释贝叶斯概率

    三门问题(Monty Hall problem)亦称为蒙提霍尔问题、蒙特霍问题或蒙提霍尔悖论,大致出自美国的电视游戏节目Let’s Make a Deal。
    问题名字来自该节目的主持人蒙提·霍尔(Monty Hall)。参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门可赢得该汽车,另外两扇门后面则各藏有一只山羊。当参赛者选定了一扇门,但未去开启它的时候,节目主持人开启剩下两扇门的其中一扇,露出其中一只山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。问题是:换另一扇门会否增加参赛者赢得汽车的机会?如果严格按照上述的条件,即主持人清楚地知道,哪扇门后是羊,那么答案是会。不换门的话,赢得汽车的几率是1/3。换门的话,赢得汽车的几率是2/3。——百度百科

    最近对于贝叶斯概率的理解有一定的加深,所以想趁这个机会解决一下这个经典的决策问题。

由于现在的高校学生接触到的概率大都是频率概率而非贝叶斯概率,而频率概率对于贝叶斯公式的解释极其含糊不清难以理解。我写这个的其中一个目的主要是为了说明贝叶斯公式在贝叶斯概率中的含义而并不是只是说“诶呀这个问题用贝叶斯公式就能解出来了”——关键是,怎么去理解贝叶斯公式而非贝叶斯公式怎么用。

    贝叶斯概率的一些基础思想:

  • 概率被定义为某人对一个命题信任的程度,这个概率不像频率概率范畴是描述某个随机事件发生的可能性的一个未知的定值,而是一个未知的可以变化的值
  • 先验概率:根据以往经验和分析得到的概率
  • 后验概率:在得到随机事件的结果之后对先验概率进行修正之后的概率
  • 全概率公式:将复杂事件的概率求解转换为简单概率求解的方法
  • 贝叶斯公式/定理:贝叶斯概率与贝叶斯统计的基础,基本上是用来计算后验概率的公式

    那么我们就来解决一下这个问题:

  1. 最开始的时候,我们对这三扇门之后有什么一无所知,所以我们最好的做法是公平对待三扇门,我们假设 An,n=1,2,3 为第 n 个门之后有汽车,那么我们有P(An)=1/3
  2. 假设我们选择门1,主持人打开了门2,这时根据我们打开的门之后是否有汽车,主持人打开的门的概率是会有变化的:如果门1后有汽车,对于一般人(精神正常的人)来说,主持人打开门2和门3的概率基本上应该是一致的,为1/2;如果门2后有汽车,主持人打开门2的概率是0,如果门3后有汽车,主持人打开门2的概率是1。
  3. 我们设 B 为主持人打开了门2,那么我们可以得到:P(B|A1)=1/2 P(B|A2)=0 P(B|A3)=1 ,也就是2的概率解释。那么我们计算 P(A1|B) ,这个式子表示我们在得到主持人打开了门2,后面没有汽车这个事实之后,对于 P(A1) 这个概率的调整:
    P(A1|B)=P(B|A1)P(A1)P(B)
    ,而 P(B) 可以通过全概率公式计算:
    P(B)=P(B|A1)P(A1)+P(B|A2)P(A2)+P(B|A3)P(A3)=1/2
  4. 计算得到 P(A1|B)=1/3 ,这个的含义就是,当我们得到事实 B 时,我们对先验概率P(An)的值调整为了后验概率 P(An|B) 。当然如上所见,1门后有汽车的整体概率仍然没有变化,其实变化的是 P(A2|B) P(A3|B) P(A2)=1/3 变成了 P(A2|B)=0 P(A3)=1/3 变成了 P(A3|B)=2/3 ,提高的概率足够令我们改变自己的决策。

[接下来的内容想到什么补充什么吧]

  • 16
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值