耶鲁大学《博弈论》课程——非完美信息

最新推荐文章于 2025-03-16 17:18:06 发布

ZYLer_

最新推荐文章于 2025-03-16 17:18:06 发布

阅读量1.7k

点赞数 3

分类专栏：博弈论文章标签：职场和发展

本文链接：https://blog.csdn.net/ZYLer_/article/details/128765596

版权

博弈论专栏收录该内容

10 篇文章

订阅专栏

非完美信息 Imperfect Information

前面了解了同步竞价的博弈（参与人做决策时不知道其他参与人的决策）和具有完美信息的序贯博弈（我在做决策时，完全知道你做了什么决策，并且你知道我知道你的决策）。在后面这几节，会学习一种在这两种情况下的战略局势，同时分析序贯博弈和同步竞价博弈。

这里引入一个概念：信息集合(Information set)，参与人i的信息集合是一系列参与人i无法识别对方决策的参与人i的节点。这里注意，有两种树图是没有意义的：

**完美信息Perfect information：**简单来说就是博弈过程中，每一个参与人都知道之前的行动。形式化来说，完美信息是指，树图上的所有信息集合都只包含一个节点，也就是说，每个参与者都对博弈的历史阶段都有完美记忆（也就是前面那几节的形式）。

这里，我们研究非完美信息的博弈，这其实在日常中更常见，有时候我知道你做了什么，有时候又不知道。

在非完美信息的博弈中，参与人i的纯策略指的是一个完全的行动计划，它告诉参与人i在他的每一个信息集合一定要如何行动。

博弈的关键是信息，而不是时序。

【案例1】：

如下图所示博弈树：

参与人1的策略：Uu、Ud、Du、Dd

参与人2的策略：l、r

如果按照之前的纳什均衡，可以找到三个均衡点：(Uu, l) (Du, r) (Dd, r)。

但是，我们使用逆向归纳法分析博弈树，先看参与者2，不知道参与者1选了什么，但是只有两种策略，要么l，要么r，可以看出来，选l的收益是4或0，而选r的收益一定是4（因为参与者1一定不会选Uu），所以也就确定参与者2选择了r，然后再看参与者1，此时明显参与者1第一次选择会选D，所以也就找到了最佳决策是（Dd, r）。

由此可知，前面学的纳什均衡找到的均衡点，有可能是没有意义的。

【案例2】：

三人博弈，阐述纳什均衡问题。

NE(A, U, l)这个均衡并不可信，因为这个均衡，在进入子博弈时是无法达到均衡的。

子博弈(Sub-game)是博弈的一部分，它满足三个条件：

子博弈必须从单个节点开始；
它包含该节点的所有后代节点；
它不能破坏任何信息集合。

如果(s1 *, s2 *, …, sm *)它们能在任意一个子博弈中达到均衡，那它就是一个【子博弈完美均衡(SPE, sub-game perfect equilibrium)】，子博弈完美NE的一个重要特点是它可以排除不可信的威胁。（要成为SPE，本身必须是一个NE。）

在这个例子中，SPE(B, D, r)。

【别搞砸了】案例：

在这类案例中，参与人1需要确信参与人2会使用逆向归纳法，而且参与人1要相信，参与人2相信参与人1不会在最后一步搞砸，同时也要相信参与人2不会搞砸。

纳什均衡NE：(Uu, l) (Du, r) (Dd, r)

逆向归纳BI：(Uu, l)

由此可见，纳什均衡得到的结果和逆向归纳得到的结果并不完全一样，前者中有两个结果实际上并不会被选择。

这里使用子博弈精炼均衡方法尝试：

图中淡绿色的子博弈中的NE为(u)，

排除总体纳什均衡中的(Dd, r)；

图中淡红色子博弈中的NE为(u, l)和(d, r)，

再排除总体纳什均衡中的(Du, r)；

最后就剩下了唯一一个子博弈精炼均衡SPE(Uu, l)。

也就是说，子博弈精炼均衡的效果是和逆向归纳法是一样的。

【介绍人博弈】案例：

介绍人(参与人1)想要撮合大卫(2)和妮娜(3)，准备安排(send)两人一起上课，但是忘了说是哪一节课，大卫倾向Gaddis的《Cold War》，妮娜倾向Spence的《China》，博弈树如下所示：

看黄色这个子博弈：

此时，纯策略的NE(G, G)和(S, S)都会为参与人1带来1的收益，整体博弈SPE=(send, G, G)(send, S, S)，站在参与人1的角度，1的收益是优于0的，只要参与人2和3能达到均衡即可。

在这个博弈中，还有第三种均衡，即混合策略均衡。

而由前面几节得到的，性别大战中混合策略NE[(2/3, 1/3), (1/3, 2/3)]。

参与人1撮合参与人2和3，他们碰面的概率是： 2/3 * 1/3 + 1/3 * 2/3 = 4/9。

参与人1撮合时，均衡中的预期收益时：4/9 * 1 + 5/9 * (-1) = -1/9。

站在参与人1的角度，0的收益相对于-1/9是优势策略，他应该选择不撮合。SPE是（不撮合，混合策略，混合策略）。

要求解子博弈精炼均衡，只需要保持头脑清醒，求出每个子博弈的纳什均衡，然后顺着收益往回看，分析博弈树前一节点的最佳均衡。

【投资】案例：

有A和B两个公司，最初处于古诺竞争之中，情况如下图所示：

会计学的答案：

原方案年产一百万吨，使用新设备，每吨节约0.5美元，一年也就节约50万，而租用设备要70万，70 > 50，所以不应该租用。

这里的问题在于：当你的边际成本降低了之后，你会增产！
经济学的答案：

假设自己垄断，那么产量应该按照边际收益=边际成本来算。

红色矩形部分是会计师的答案，他们忽略了因为成本的降低，厂家会调整产量，也就是绿色的这个三角形。

使用经济学的方法计算，租用新设备的盈利仍然是小于租金的，应该选择不租用。
博弈论的答案：

经济学方法的问题在于，仅仅考虑了自身的产量变化。而市场还处于古诺竞争当中，还需要考虑B厂商的产量变化。

最终投资结果可以再带来31万的收益，69+31=100>70，所以应当租用设备。