博弈论读书笔记(一):囚徒困境

博弈论读书笔记

一、囚徒困境

囚徒困境的主要内容是两个共谋的犯人被抓紧监狱,并且分别关押在不同的房间里,这个时候他们无法进行有效沟通。警察也没有找到足够的犯罪证据,所以分别对两个犯人说:如果两人都对自己的犯罪事实抵赖,那么将各判刑1年;如果两人都坦白自己的犯罪事实,每个人都会被判8年;如果两人中一人坦白而另一人始终抵赖,那么坦白的会直接被放出去,而抵赖的会被判10年。

在囚徒困境中的“困境”主要来源于信息不明确可能带来的决策失误。如果双方在进入监狱之前就约定都要矢口抵赖,那么最终的结果可能对彼此都有利,达到帕累托最优(帕累托最优是资源分配的一种理想状态)。

但是从囚徒困境这个案例来看,帕累托最优方案的实现往往很困难,由于双方无法沟通,且担心对方对自己做出不利的选择,为保险起见,只好选择坦白。从某种意义上,这种坦白意味着对对方的背叛而非合作,因为人更希望另一方能够采取抵赖的姿态,但另一方通常会坚定地选择坦白。

有人提出:重复囚徒困境,让两名犯人有机会去“惩罚”和“报复”前一回合不采取合作态度的同伴,从而逼迫双方不断采取合作的态度,最终有效保证双方的决策逐渐趋于帕累托最优。问题在于,一旦约定了重复的次数,情况就会有所不同。

以十局为例,按照正常的推论而言,犯人A第一次被犯人B背叛后,第二次他也会背叛对方作为回应。如果犯人B第一次就选择沉默,坚决不认罪,那么双方可能建立起互信关系。在这里,保持沉默的态度是为了让对方在下一局也能做出相同的回应。接下来的第三局、第四局可能都是如此。

问题是:双方会一直采取这种合作态度吗?情况可能并非如此,由于约定了重复的囚徒困境为十局,那么第十局其中一方可能采取背叛的态度,因为这是他最后的机会来逃脱坐牢的命运。

根据这一点,可以往前推。对于两名犯人,他们都会猜测对方可能在第十局背叛自己,那么第九局时保持沉默与合作的态度已经毫无意义,因为这原本就是为第十局做出沉默策略做铺垫的,既然第十局双方有可能背叛,那么两人在第九局就没有必要保持沉默。以此类推,第八局双方也会背叛对方,第七局同样也会…这样一来,直到第一局,双方都会采取互相背叛的策略。

*也就是说,在重复十局的囚徒困境中,每一句双方都会以互相背叛的方式继续下去。

可以说,想通过重复囚徒困境的方式来打破相互背叛的僵局,实现帕累托最优,前提条件是不能给出具体的次数,因为一旦规定了次数,那就意味着每一个人都有机会通过背叛的方式来实现“不用坐牢”的目的。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值