博弈论读书笔记（一）：囚徒困境

最新推荐文章于 2021-12-30 18:36:16 发布

funny※

最新推荐文章于 2021-12-30 18:36:16 发布

阅读量846

点赞数

本文链接：https://blog.csdn.net/qq_39462906/article/details/102920687

版权

博弈论读书笔记

一、囚徒困境

囚徒困境的主要内容是两个共谋的犯人被抓紧监狱，并且分别关押在不同的房间里，这个时候他们无法进行有效沟通。警察也没有找到足够的犯罪证据，所以分别对两个犯人说：如果两人都对自己的犯罪事实抵赖，那么将各判刑1年；如果两人都坦白自己的犯罪事实，每个人都会被判8年；如果两人中一人坦白而另一人始终抵赖，那么坦白的会直接被放出去，而抵赖的会被判10年。

在囚徒困境中的“困境”主要来源于信息不明确可能带来的决策失误。如果双方在进入监狱之前就约定都要矢口抵赖，那么最终的结果可能对彼此都有利，达到帕累托最优（帕累托最优是资源分配的一种理想状态）。

但是从囚徒困境这个案例来看，帕累托最优方案的实现往往很困难，由于双方无法沟通，且担心对方对自己做出不利的选择，为保险起见，只好选择坦白。从某种意义上，这种坦白意味着对对方的背叛而非合作，因为人更希望另一方能够采取抵赖的姿态，但另一方通常会坚定地选择坦白。

有人提出：重复囚徒困境，让两名犯人有机会去“惩罚”和“报复”前一回合不采取合作态度的同伴，从而逼迫双方不断采取合作的态度，最终有效保证双方的决策逐渐趋于帕累托最优。问题在于，一旦约定了重复的次数，情况就会有所不同。

以十局为例，按照正常的推论而言，犯人A第一次被犯人B背叛后，第二次他也会背叛对方作为回应。如果犯人B第一次就选择沉默，坚决不认罪，那么双方可能建立起互信关系。在这里，保持沉默的态度是为了让对方在下一局也能做出相同的回应。接下来的第三局、第四局可能都是如此。

问题是：双方会一直采取这种合作态度吗？情况可能并非如此，由于约定了重复的囚徒困境为十局，那么第十局其中一方可能采取背叛的态度，因为这是他最后的机会来逃脱坐牢的命运。

根据这一点，可以往前推。对于两名犯人，他们都会猜测对方可能在第十局背叛自己，那么第九局时保持沉默与合作的态度已经毫无意义，因为这原本就是为第十局做出沉默策略做铺垫的，既然第十局双方有可能背叛，那么两人在第九局就没有必要保持沉默。以此类推，第八局双方也会背叛对方，第七局同样也会…这样一来，直到第一局，双方都会采取互相背叛的策略。

*也就是说，在重复十局的囚徒困境中，每一句双方都会以互相背叛的方式继续下去。

可以说，想通过重复囚徒困境的方式来打破相互背叛的僵局，实现帕累托最优，前提条件是不能给出具体的次数，因为一旦规定了次数，那就意味着每一个人都有机会通过背叛的方式来实现“不用坐牢”的目的。

funny※

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
博弈论读书笔记（一）：囚徒困境

博弈论读书笔记一、囚徒困境囚徒困境的主要内容是两个共谋的犯人被抓紧监狱，并且分别关押在不同的房间里，这个时候他们无法进行有效沟通。警察也没有找到足够的犯罪证据，所以分别对两个犯人说：如果两人都对自己的犯罪事实抵赖，那么将各判刑1年；如果两人都坦白自己的犯罪事实，每个人都会被判8年；如果两人中一人坦白而另一人始终抵赖，那么坦白的会直接被放出去，而抵赖的会被判10年。...
复制链接

扫一扫