《 博弈论教程(罗云峰版) 》——习题一答案

前言

博弈论这门课程,我们主要参考的教材是《博弈论教程(罗云峰版)》,但是罗老师的课后习题并没有给出完整的答案,秉着学习的态度,本人结合教材和 PPT 在这里给出课后习题的答案。

由于我们只学了完全信息静态博弈和完全信息动态博弈,即第一部分和第二部分,因此,本人只写了习题一和二。在写题的过程中难免出错,欢迎大家指出,同时希望能够给大家提供一些帮助。

1、概念理解

(1)什么是博弈?试举例说明博弈问题与传统决策问题有什么不同。

答:博弈是多个参与人参与决策,每个参与人都想使自己利益最大化,并根据其他参与人的行动做出使自己利益最大化的决策过程。

以新产品开发博弈为例,博弈问题需要多个企业共同参与,单个企业参与并不能叫做博弈(假设自然不作为博弈的参与人),博弈需要企业之间根据对方的行动进行分析,经过推理最终做出决策;而传统的决策问题可以只由自己做出决策,不需要经过对方行动进行分析。

题解】

完全理性的个人或群体的行为发生直接相互作用的情形。当一个主体,如一个企业或团体,他的选择受其他企业或团体选择的影响,而且反过来影响其他人选择时的决策问题和均衡问题(稳定问题)。

博弈论研究这种情形下个人或群体的选择(即决策)以及这种选择所导致的结果的理论。

博弈论研究:在存在相互外部经济条件下的个人选择问题,即策略依存性问题

“交互的决策论”、“相互影响的决策理论”

(2)什么是共同知识?试举例说明共同知识与相互知识的区别。(先看题3)

答:共同知识指的是,参与人知道其他参与人的信息,其他参与人也知道参与人知道其他参与人的信息,即互相都知道对方,且知道对方知道自己知道。而相互知识没有这么强的条件,只要求参与人之间互相知道信息,但是没有要求,参与人知道其他参与人知道自己知道。

题解】

所谓共同知识是指:如果有一种每个参与人都知道的“信息(或事件)”,并且每个参与人都知道每个参与人都知道它,每个参与人都知道每个参与人都知道每个参与人都知道它,……,如此等等,那么这种“信息”对参与人而言就是共同知识。

显然,关于一个事件的共同知识这一概念比人们所熟悉的“相互知识”需要更多的信息,共同知识则是无穷尽的“相互知识”。

(3)什么是完全理性假设?完全理性为共同知识对博弈分析有什么意义?试举例说明。

答:完全理性假设指的是,所有参与人都是理性的,且知道其他参与人是理性的。博弈分析是建立在完全理性为共同知识的前提下的,在完全理性假设的条件下,分析参与人的行动才能有所依据。以囚徒博弈为例,完全理性假设即为囚徒1想使得自己的坐牢时间最少,也知道囚徒2也想使自己坐牢时间最少,然后囚徒1会分析自己不同的行为,来分析囚徒2的行为。囚徒2也会根据囚徒1进行分析,最终能得到博弈的结果。

题解】

参与人完全理性假设:参与人追求效用最大化时能前后一致的做决策,即参与人的行为和目标具有一致性。

完全理性假设的主要表现:

  1. 参与人的偏好具有一致性;

  2. 参与人对所面临的决策问题具有完全的理解;

  3. 参与有具有强大(甚至无限的)逻辑推理能力和计算能力。

举例说明:如猜数游戏

在猜数游戏中,预测参与人在博弈中的行为是非常复杂的,想要得到一个明确且肯定(而不仅仅是猜测)的结论,是有很强的前提条件的。为了便于对参与人在博弈中的行为进行预测,同时保证得到一个逻辑上严谨且一致的结论,在分析博弈问题时,除了假设参与人完全理性外,博弈论的分析框架还要求博弈问题的结构(或者对博弈问题的描述)和参与人完全理性是共同知识

由此,引出了共同知识的概念——题(2)

(4)在博弈中,划分完全信息和不完全信息的标准是什么?划分静态博弈和动态博弈的标准是什么?划分合作博弈和非合作博弈的标准是什么?

答:根据参与人对信息的了解程度进行划分:若所有参与人都知道博弈开始阶段的全部信息,即为完全信息博弈。参与人在博弈开始阶段的所知道的信息不对称,即有的参与人知道的信息更多,有的参与人知道的信息不全面,即为不完全信息博弈。

根据博弈过程中的行动的顺序进行划分:若博弈过程中所有参与人都是同时行动,不存在先后顺序,即为静态博弈。若博弈过程中参与人有行动的先后顺序,即为动态博弈。

根据博弈中参与人是否可以进行沟通、交流和协商进行划分:若博弈中参与人能互相交流,并通过协商得到更优解,即为合作博弈。若参与人不能协商交流,只能独立地根据推断对方地行为做出决策,即为非合作博弈。

题解】

完全信息与不完全信息:

动态博弈与静态博弈:

合作博弈与非合作博弈:

(5)什么是博弈的战略式?你认为构成一个博弈问题的最基本要素是什么?为什么?

答:博弈的战略式指的是,每个参与人根据推理分析其他参与人的行为,制定出一套完备的战略(行动的准则),当其他参与人做出这个行为的时候,我该做出什么行为。将所有参与人的战略通过一个表格进行列写,即可得到博弈的战略式,其只能体现出博弈的静态过程。

构成博弈问题最基本的要素是参与人、战略、收益(忘了)

参与人是博弈的主体、战略是博弈过程的体现

题解】

战略式博弈的定义:

战略式博弈最基本的要素(两种定义方式)

(6)什么是参与人的战略?战略和行动是等同的吗?试举例说明

答:参与人的战略是参与人行动的规则,战略不等于规则。战略是行动的依据,战略包含了在所有可行情况下应该采取的行动。以动态新产品开发博弈为例,企业1有开发、不开发两种行动,企业2也有开发和不开发两种行动。企业1先决策,企业1的战略为{开发、不开发},企业2后决策,其中一个战略为{(开发,开发)、(不开发,开发)},而企业2的行动只有开发或者不开发,即行动集为{开发、不开发},而战略集包括了这种战略,如下所示:

{(开发,开发)、(不开发、开发)}

{(开发,开发)、(不开发、不开发)}

{(开发,不开发)、(不开发、开发)}

{(开发,不开发)、(不开发、不开发)}

但是在静态博弈中,行动集和战略在表达上一样。

题解】

战略(strategy),是参与人的行动规则,它规定了参与人在每一种轮到自己行动的情形下,应该采取的行动。

举例说明:以“新产品开发博弈”为例

值得注意的是:

(7)在博弈论中,博弈问题的解是什么?为什么Nash均衡可以作为博弈问题的解?Nash均衡作为博弈问题的解存在什么问题?

答:博弈问题的解即为Nash均衡,即所有参与人为使自己的收益最大化做出行动,让博弈过程达到了一个均衡的状态,且稳定于该状态不会改变。

因为Nash均衡满足公式 u(vi,vj) >= u(vi',vj),其中 vi'为不包含vi的全部情况,vj为其他参与人的战略。对于所有参与人都满足该等式,因此可以作为博弈问题的解。

Nash均衡作为博弈问题的存在多重性问题。

题解】

在博弈论既有的分析框架下,参与人的一致性预测就是博弈问题的解。

在传统的博弈论中,一般都将Nash均衡作为博弈的解。Nash均衡就是在没有外在强制的情况下,能够自动执行的策略。

一个战略组合如果不是Nash均衡的话,就不能成为博弈的解。

对于Nash均衡为什么能成为博弈的解,ChatGPT如是说:

Nash均衡是博弈论中一种重要的解概念,它被广泛应用于博弈问题的分析和解决。下面是为什么Nash均衡可以作为博弈问题的解的解释:

  1. 个体理性行为:在一个博弈中,每个参与者都是理性的,即他们会根据自身的利益来做出决策。Nash均衡是一种状态,其中每个参与者都采取了最优的策略,假设其他参与者的策略不变。这意味着在Nash均衡下,没有参与者有动机去单方面改变自己的策略,因为这样做不会使他们获得更好的结果。

  2. 相互依赖性:在博弈中,参与者的决策往往会受到其他参与者的决策影响。Nash均衡考虑了这种相互依赖性,它是一种状态,其中每个参与者的策略与其他参与者的策略相匹配。换句话说,如果所有参与者都采取了Nash均衡策略,那么没有人会希望改变自己的策略,因为这样做会使他们的结果变得更差。

  3. 稳定性:Nash均衡具有一种稳定性,即它是一个自我维持的状态。如果一个博弈达到了Nash均衡,那么在没有外部干扰的情况下,参与者将会保持在这个状态下。这种稳定性使得Nash均衡成为博弈问题的合理解,因为它描述了一个可以持续存在的均衡状态。

需要注意的是,Nash均衡并不一定是唯一的解,一个博弈可能存在多个Nash均衡点,甚至可能不存在Nash均衡。此外,Nash均衡并不保证达到最优结果,它只是一种稳定的状态。因此,在实际应用中,我们需要根据具体情况对Nash均衡进行进一步分析和评估。

(8)占优均衡和重复剔除劣战略对参与人的理性要求有何不同?在有限战略式博弈中,是否一定要求完全理性为共同知识,才能确保重复剔除劣战略占有均衡成为博弈的解?

答:占优均衡指的是参与人分析所有战略下的收益,若u(vi,vj) >= u(vi',vj),其中 vi'为不包含vi的全部情况,vj为其他参与人的战略,参与人1即可选择该占优战略。占优均衡要求全部参与人都选择占优战略,因此需要参与人完全理性。

重复剔除劣战略指的是参与人剔除掉自己某一个使得自己收益都小于已有战略的战略,即存在一个战略,比另一个战略在其他参与人决策情况下都小,即为劣战略。

好难,已经不会了。

题解】

(9)举例说明在采用重复剔除劣战略的方法求解博弈问题时,剔除顺序对博弈结果有什么影响。

答:重复剔除劣战略没有影响,但是剔除弱劣战略对于完全信息动态博弈有影响,对于剔除完全信息静态博弈也没有影响。

题解】

(10)什么是战略式博弈的混合战略?纯战略和混合战略有什么区别?最优混合战略有什么特点?

答:战略式的混合战略指的是,在参与人以某一个概率选择行动。即行动均为概率的表达,不是确定的行动,而是有p1的概率选择行动1,有p的概率选择行动2,其中p1+p2=1

混合战略和纯战略的区别在于混合战略是通过概率行动,而纯战略是确定的表达,可以认为纯战略是要求行动概率为1的行动规则。

最优混合战略具有等值性,即无论收益与自己行动的概率无关。

题解】

混合战略与纯战略的比较如下:

最优混合战略的特性

(11)什么是混合战略Nash均衡?你是如何理解混合战略Nash均衡的?

答:混合战略Nash均衡满足如下等式:

u(pi,pj) >= u(pi',pj)

混合战略Nash均衡是Nash均衡的推广,它结合概率的知识,将Nash均衡从0和1,推广到了 [0,1],将Nash均衡的解进行了延拓。

题解】

(12)使用支撑法求解Nash均衡需要注意什么问题?采用什么方法可以减少求解过程中的计算量。

答:支撑法需要注意讨论解是否是Nash均衡。

  1. 解需要满足范围属于[0,1]

  2. 解需要满足该战略下的收益大于其他纯战略下的收益

在使用支撑法求解之前先剔除劣战略,减少支撑,能有效减少计算量。

题解】

使用支撑法求解应该注意的问题

减少计算量的方法:排除一些不可行的支撑

(13)在现有的博弈分析框架下,非Nash均衡能够作为博弈的解吗?为什么?试举例说明。

答:不能。因为博弈的目标是使得自己的收益最大化,因此需要满足公式 u(vi,vj) >= u(vi',vj),其中 vi'为不包含vi的全部情况,vj为其他参与人的战略。以新产品开发博弈为例,非Nash均衡显然不能使得自己开发既得收益最大,因此不能作为博弈的解。

题解】

不能,说明如下:

以斗鸡博弈为例进行说明:

再举出一例进行说明:

(14)什么是“焦点效应”?试举例说明“焦点效应”如何解决Nash均衡多重性问题的。

不会写的题目

题解】

以“性别战”为例:

需要注意的是:聚焦因素只有针对Nash均衡时才可能是有效的。

(15)什么是“廉价磋商”?试举例说明“廉价磋商”在什么情况下才是有效的。

不会写的题目

题解】

达成“廉价磋商”需要的条件:

以“性别战”博弈为例,满足下面情形时,“廉价磋商”有效:

  • 夫妻之间相互信任,说话算数,博弈之前的沟通,就可以将博弈引向特定的均衡。

  • 丈夫位于主导地位(因为只有丈夫可以提出建议),因此,理性的丈夫可以利用夫妻间的信任,将博弈引向有利于自己的均衡上

(16)什么是“相关均衡”?构造“相关均衡”的关键是什么?

不会写的题目

题解】

(17)Cournot模型与Bertrand模型的基本假设有什么不同?在Hotelling模型中,产品的差异性由什么来表示?在什么情况下Hoteling模型可以看成是Bertrand模型?

答:

Cournot模型和Bertrand有些忘了

在Hotelling模型中,产品的差异性由距离来表示,即产品的运输成本因为距离不同而有所不同。

若所有参与人的产品没有差异性,即产品的运输成本没有地域差异,两个商铺都在同一个点,那么Hotelling就退化成了Bertrand模型。

题解】

(18)在Hardin公共财产问题中,“羊”的价值函数满足什么条件?为什么要这样规定?试说明理由。

答:

“羊”的价值函数满足如下条件:

  1. 一阶导大于0

  2. 二阶导小于0

即“羊”带来的价值,随着数量的增加而不断增加,但是增加的幅度越来越小,价值增长变慢,趋于饱和。

这样规定符合实际的生产情况,因为草地有一定的环境承载力,当羊的数量增加的时候,实际上增加“羊”带来的价值没有之前增加那么多了。

题解】

(19)通过完全信息静态博弈的学习,你认为博弈论中,最重要的概念是什么?说明理由。

答:我认为博弈论中的最重要的概念是战略。战略具有完备性,每一个参与人都d是基于战略进行的推断和分析。战略是一个参与人的基本行动准则,没有战略就无法开展博弈。在完全信息静态博弈中,我们主要分析的也是战略式博弈。

2、现象解释

(1)为什么在大城市中心地区禁鸣喇叭

提示】

思路一:构造战略式博弈,参与人为车主1和车主2,行动为鸣喇叭和不鸣喇叭,构造合适的收益矩阵。

思路二:构造战略式博弈,参与人为车主和居民,车主行动为鸣喇叭和不鸣喇叭,居民行动为让路和不让路,构造合适的收益矩阵。

(2)摊贩为什么都喜欢往市场门口挤

提示】

结合Hotelling模型,决策变量为价格,产品在空间位置有差异。

(3)为什么会出现银行挤兑现象,如何预防这种现象

ChatGPT如是说:

银行挤兑现象指的是大量存款人同时对银行发起提款请求,导致银行无法满足所有提款需求,从而引发金融风险和系统性危机。这种现象通常发生在存款人对银行的信心受到严重动摇时,担心银行无法偿还存款或出现其他风险。

银行挤兑现象的出现可以通过博弈论的视角进行分析。在这个情境中,存在着多方参与者(存款人)和他们的决策互动。存款人的决策会受到其他存款人的决策影响,因为他们都希望尽早提取资金以避免损失。这导致了一个博弈问题,其中存款人需要权衡自己的利益和其他存款人的行为。

有几个因素可能导致银行挤兑现象的发生:

  1. 信息不对称:存款人通常无法准确了解银行的财务状况和风险程度。当有关银行的负面消息传播开来时,存款人可能会因为担心银行的风险而发起挤兑。

  2. 羊群效应:存款人的决策可能受到其他存款人的行为影响。当一些存款人开始挤兑银行时,其他人可能会跟随其后,形成了羊群效应,导致更多的存款人加入挤兑行列。

为了预防银行挤兑现象,可以采取以下措施:

  1. 加强监管和透明度:加强对银行的监管,确保银行的财务状况和风险得到有效披露,提高存款人对银行的信心。监管机构应及时发布相关信息,避免信息不对称。

  2. 建立储备金制度:银行可以建立储备金制度,将一部分存款作为准备金留存,以应对突发情况。这样可以增加银行的偿付能力,降低挤兑风险。

  3. 提供保险机制:建立存款保险制度,对存款人进行保护,一旦银行出现问题,存款人可以获得一定程度的赔偿。这可以提高存款人的信心,减少挤兑的可能性。

  4. 增强公众教育:加强对公众的金融知识教育,提高存款人的风险意识和理性决策能力,减少因恐慌而引发的挤兑行为。

3、巫师的诅咒

提示】

需要100天,第99天男人们知道了99个妻子不忠为共同知识,第100天男人们推理知道自己的妻子不忠,100个男人同时痛哭。

可以先将问题退化成4个新婚夫妇进行考虑。

第一天,巫师说话,已知一个妻子不忠。

第二天,每个男人推理分析,等价已知两个妻子不忠。

第三天,每个男人推理分析,等价已知三个妻子不忠。

第四天,每个男人推理分析,如果三个妻子不忠,而自己妻子忠心的话,那么肯定会有一个男人痛哭。而此时,没有男人痛哭,说明其他男人都知道有三个妻子不忠,但是其他男人不知道自己妻子的情况,说明其他男人除了自己妻子之外还知道三个妻子不忠,那不就包括自己的妻子了。因此推理出自己的妻子不忠,四个男人同时痛哭。

4、信封之谜

提示】

混合战略Nash均衡,期望收益。

5、求解纯战略Nash均衡

答案】

通过画线法或箭头法求解纯战略Nash均衡:

  • 图(a):(D,R)

  • 图(b):(U,L)、(D,R)

6、重复剔除劣战略求解纯战略Nash均衡

答案】

  • 图(a):(U,M)

  • 图(b):(U,L)

7、用支撑法求解战略式博弈的Nash均衡

答案】

图(a)解答:

图(b)解答:

【参考答案】

8、用规划法求解战略式博弈的Nash均衡

答案】

【参考答案】

对于规划法只需记住下面的公式,并代入运算即可:

9、求解战略式博弈的Nash均衡

图a题解】

图b题解】

10、收益矩阵的参数范围问题

提示】

分析参与人1和参与人2,不难发现参与人1支付矩阵的转置即为参与人2的支付矩阵,参与人1和2满足同构关系.

(1)① a>b,c<0

   ② a<b,c>0

(2)同(1)

(3)同(1)

(4)等值法列出的等式有解

上面问题的题干有误,修改如下:

题解】

11、“智猪博弈”问题

题解】

战略式博弈的一般求解步骤+求解纯战略Nash均衡和混合战略Nash均衡,分析“智猪博弈”的结果,联系实际。

12、“投票博弈”,经典的三人博弈问题

题解】

13、“修路博弈”,Nash均衡的应用

提示】

A、B可能为富人可能为穷人,分三种情况进行讨论,即

  1. A、B均为富人

  2. A、B一个为富人,一个为穷人

  3. A、B均为穷人

然后对这三种情况分别给出博弈的战略式描述,并进行纯战略Nash均衡和混合战略Nash均衡的求解,对Nash均衡解进行分析。

14、“企业工人博弈”,经典战略式博弈

题解】

15、“分钱博弈”,剔除劣战略

题解】

16、n人Cournot模型

题解】

17、“监督税收博弈”

题解】

18、“分蛋糕博弈”,连续战略型+焦点均衡

题解】

讲解视频:

1.9.1【博弈论】连续战略型-分蛋糕问题_哔哩哔哩_bilibiliicon-default.png?t=N7T8https://www.bilibili.com/video/BV1wM4y1L7JG/?spm_id_from=333.788

Nash均衡为(1,1)和(S1,S2)其中S1+S2=1

焦点均衡为(0.5,0.5)

19、Bertrand模型的应用

题解】

该题仍为连续战略型,需要对支付函数进行分析。

20、“n人分蛋糕博弈”,连续战略型+焦点均衡

题解】

不妨设赌徒的总钱数为C

类比前面19题的“分蛋糕博弈”,由参与人为2人推广至参与人为n人,通过对连续战略型的求解,不难得到

Nash均衡为(C,C,……,C),(S1,S2,……,Sn)其中 S1+S2+S3+……Sn=C

受“焦点效应”的影响,最可能出现的是(S1/n,S2/n,……,Sn/n)

21、大国税收博弈

题解】

模型推广见 8.3 关税与国际市场

25、Hotelling模型的应用

题解】

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

猪猪的超超

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值