博弈论四种类型之完全信息静态博弈-CSDN博客

本文链接：https://blog.csdn.net/panxiqie/article/details/48879119

本文深入探讨完全信息静态博弈，通过囚徒困境和智猪博弈两个经典案例，阐述纳什均衡、优势战略均衡和重复剔除劣势战略均衡的概念。分析了个人理性与集体理性之间的冲突，并提出解决策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

决策需要信息，几乎所有需要决策的场合我们都掌握着有限信息，这使得现实中往往是有限信息博弈。完全信息在这里指的是每个参与人对其他参与人的支付函数有着完全的了解。而静态指的是同时行动的博弈，或者不同时但后行动者不知道之前行动者的决策。
在完全信息静态博弈中的均衡是纳什均衡。最典型的例子是囚徒困境与智猪博弈。下面就由这两个例子展开，并将在博弈论中的一些知识点做出介绍。
【囚徒困境】中基于收益矩阵的模型描述如下：
这里写图片描述
【注】博弈中参与人只拥有有限个离散性的纯战略供其选择称为离散型策略。而在另外一些博弈中，每个参与者的纯策略可以是来自连续范围的一个数，如厂商定价，称为连续型策略。离散型策略静态博弈可以用支付表来表示，如上图。
对于囚徒A与B来说，无论对方采取什么策略，自己的策略是“坦白”时总是比“抵赖”要好些，在两人无法通信的情况下，两人都会选择“坦白”。
【优势战略均衡】在这里，无论对方选择什么，“坦白”的收益是严格大于“抵赖”，所以“坦白”是一个严格优势策略，对应的“抵赖”则是一个劣势策略。所有人都有自己的优势策略，由此产生的优势策略组合是一个优势战略均衡。
但是这里需要注意的是，双方各自的优势策略却导致了集体的利益最差，如果两人都选择“抵赖”收益将是各自-1，但是优势策略下的收益却是-8.囚徒困境反映了个人理性与集体理性的冲突。个人的最优选择从社会角度看并不是最优的。社会生活中有很多例子：公共品的给予，商家的价格战，团队生产中的偷懒（三个和尚没水喝），小学生减负越减越重，各国军备竞赛等。
【如何走出囚徒困境】如果有