博弈论中静态博弈经典场景案例

别叫我派大星

于 2023-09-30 15:05:14 发布

阅读量3.8k

点赞数 3

文章标签：博弈论田忌赛马猎鹿博弈制式问题夫妻之争双寡头削价竞争囚徒困境

本文链接：https://blog.csdn.net/qq_43403025/article/details/133434064

版权

博弈论中静态博弈经典场景案例

1、齐威王田忌赛马

田忌赛马是中国家喻户晓的故事，故事讲述的是齐国大将田忌的谋士孙膑如何运用计谋帮助田忌在与齐威王赛马时以弱胜强的故事，这个故事其实本质也是一个博弈的过程。
齐威王要和田忌赛马，赛马规则如下：
故事中说齐威王经常要田忌与他赛马,赛马规则如下:每次双方各出3匹马,一对一比3场,每一场输方输一千斤铜给赢方。齐威王和田忌的3匹马按实力都可以分上、中、下三等，但齐威王的上、中、下3匹马分别比田忌的上、中、下3匹马略胜一筹,因为总是同等次的马进行比赛，因此田忌每次都连输3场。那这不是纯纯欺负人嘛，但实际上田忌的上马虽然不如齐威王的上马，但比齐威王的中马和下马都要好,而田忌的中马比齐威王的下马要好一些，因此孙膑看不下去田忌当冤大头，就给田忌出主意，让田忌用自己的下马对抗齐威王的上马,上马对抗齐威王的中马,中马对抗齐威王的下马，这样对于田忌而言就是二胜一负，能赚上个一千铜。
将这个故事抽象成博弈，则博弈方自然是齐威王和田忌，博弈策略是己方马匹的出战顺序（注意双方都是一次性定下三场比赛的出战顺序，而非一场一场进行），那根据排列组合的知识就知道，每一方都有3!=6种策略选择，比如“上中下”、“中上下”等等；双方同时进行决策(静态博弈)；赢一千铜记为1，输一千铜记为-1。如此就可以发现，因为双方均有6种策略可选，则可能得结果为6x6=36种，我们将双方的得益用矩阵表示，如此得到得益矩阵(payoff matrix)，具体如下。其中，前一位数字表示齐威王的得益，后一位数字表示田忌的得益。

在这里插入图片描述

结合表格，我们思考一下该博弈的特点：
首先,无论对齐威王还是田忌,博弈中的六种可选择策略本身相互之间并没有优劣之分。对齐威王来说,每一种策略对应六种结果,包括一种得益为3,四种得益为1,一种得益为-1 ,究竟最终得哪种结果,主要看对方策略与己方策略的对应情况,而不是己方策略本身。同样地，田忌也是如此。
其次,各博弈方千万不能让对方知道或猜中自己的策略,因为一旦自己的策略被对方猜中,对方就可以针对性选择策略,己方必输无疑。这也意味着,如果重复多次得进行该博弈，任何一方的策略选择不能一成不变,变动不能有规律性,必须以随机的方式选择策略。

2、囚徒的困境

“囚徒的困境”是博弈问题中相当经典的基本模型，该问题非常简单,却能很好地反映博弈问题的根本特征,也是有效解释众多经济现象的基本模型。下面介绍一下谢老师书中改编的版本：
警察抓住两个合伙犯罪的罪犯,但缺乏足够证据指证他们的罪行。如果其中至少一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将两名罪犯分别关押以防止串供或结成攻守同盟，并给他们同样的选择机会:如果两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判1年徒刑；如果两人中有一人坦白认罪，则坦白者从轻处理，立即释放，另一人则将重判8年徒刑；如果两人同时坦白认罪，则他们将被各判5年监禁。
本博弈的博弈方是两个罪犯，分别称“囚徒1”、“囚徒2”。本博弈两个博弈方的可选择策略均为“不坦白”和“坦白”两种。因为两个囚徒被隔离开，其中任何一人选择策略时都不可能知道另一人的选择是什么，因此不管他们决策的时间是否真正相同，我们都可以认为他们是同时决策的。
如果分别用-1、-5和-8表示罪犯被判刑1年、5年和8年的得益，用0表示罪犯被立即释放的得益，则可以用下图所示的得益矩阵将这个博弈表示出来。其中，前一个数字为囚徒1的得益，后一个数字为囚徒2的得益。
在这里插入图片描述

根据个体理性行为准则,两个博弈方的目标都是实现自身的最大利益。首先可以肯定的是,在这个博弈中,两博弈方各自的利益不仅取决于他们自己选择的策略,也取决于对方的策略选择。每个博弈方选择自己的策略时,即使无法知道另一方的实际选择,也必须考虑另一方有两种可能的选择,而且另一方的选择对自己的利益影响很大。

对于囚徒1：

(1) 在囚徒2选择“坦白”的情况下，囚徒1的得益分别为-5(“坦白”)、-8(“不坦白”)，因此该情况下，囚徒1的最优策略即上策(dominant strategy)为“坦白”；
(2) 在囚徒2选择“不坦白”的情况下，囚徒1的得益分别为0(“坦白”)、-1(“不坦白”)，因此该情况下，囚徒1的最优策略即上策(dominant strategy)也为“坦白”。

因此可以发现，虽然囚徒1的得益与囚徒2的策略有关，但不论囚徒2的策略如何，囚徒1的最优选择均是“坦白”！

囚徒2也类似：

(1)在囚徒1选择“坦白”的情况下，囚徒2的得益分别为-5(“坦白”)、-8(“不坦白”)，因此该情况下，囚徒2的最优策略即上策(dominant strategy)为“坦白”；
(2)在囚徒1选择“不坦白”的情况下，囚徒2的得益分别为0(“坦白”)、-1(“不坦白”)，因此该情况下，囚徒2的最优策略即上策(dominant strategy)也为“坦白”。

所以，该博弈的最终结果必然是两博弈方都选择“坦白”，双方得益均为-5,即都被判5年徒刑。
但是！！！
需要注意的是，在这个博弈中，无论是对两个囚徒总体（囚徒1和囚徒2的得益之和）来讲，还是对他们各自来讲，最佳的结果都不是同时“坦白”(-5,-5)，而是都“不坦白”(-1,-1)。但是，由于两个囚徒不能串通，并且各人都追求自己的最大利益而不会顾及同伙的利益，因此只能实现对他们都不理想的结果，这也是该博弈被称为“囚徒的困境”的原因。当然,囚徒的困境对社会利益来说是理想的,因为罪犯都受到了应有的惩罚。但从博弈中两个决策者的立场上说则很不理想，因为既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益。

3、双寡头削价竞争

双寡头削价竞争本质上也是囚徒的困境，其实囚徒的困境在社会经济中有很大的普遍性，在市场竞争的各个领域、政治、军事和法律等各种领域的问题中,都存在类似囚徒的困境现象。双寡头价格战就是其中一个典型案例。
通过降价争夺市场是市场竞争中十分普遍的行为，但价格竞争并不一定是成功的策略，因此一个厂商降价往往会导致其他厂商也降价或者采取其他商业行为，而导致利润率以及销量的降低。这里用一个简单的双寡头两种价格的价格竞争模型来说明这个问题。
设寡头1和寡头2是双寡头市场的两个寡头,它们原来用同一种较高的价格(“高价”)销售相同的产品。如果两个寡头不满足各自原来的市场份额和利润，就可能想通过降价争夺更大市场份额和更多利润。但自己降价可能引起对手的报复，目的并不一定能达到。假设两寡头同时“高价”各可以获得100万元利润；如果某个寡头单独降价，即单独采用“低价”,可以获得150万元利润，此时另一寡头因为市场份额被蚕食，利润将下降到20万元；如果另一寡头也降价，则两寡头都将只能得到70万元利润。得益矩阵如下图所示，前一个数字为寡头1的得益，后一个数字为寡头2的得益：
在这里插入图片描述

对于寡头1：
（1）当寡头2选择“高价”时，寡头1的得益分别为100（高价）、150（低价），因此该情况下，寡头1的最优策略为“低价”；
（2）当寡头2选择“低价”时，寡头1的得益分别为20（高价）、70（低价），因此该情况下，寡头的最优策略为“低价”。

可以发现，与囚徒的困境相似，虽然寡头1的得益与寡头2的策略有关，但不论寡头2的策略如何，寡头1的最优选择均是“低价”！寡头2也是如此，因此该博弈的最终结果必然是两博弈方都选择“低价”，双方得益均为70，这是两博弈方按照个体理性原则决策的必然结果。
虽然这个结果对两寡头来说都不理想，但因为两寡头都必须防备对方利用自己的合作精神(即认为自己会和对方合作，均保持高价)谋取利益，所以双方都不可能坚持采用“高价”，各得100万元利润的结果是无法实现的。
囚徒困境式矛盾的存在,一定程度上否定了传统经济理论关于市场经济“看不见的手”总能把个人利己行为变为对集体、社会有利行为的论断,也说明了政府的组织协调在社会经济活动中是必需的,放任自流并不会导致全社会的最大福利。

4、猜硬币

猜硬币是生活中最常见的游戏，具体来讲：一人用手盖住一枚硬币，由另一方猜是正面朝上还是反面朝上,猜对则猜者赢1元，盖硬币者输1元；否则，猜者输1元,盖硬币者赢1元。如果赢1元得益为1,输1元得益为-1，则得益矩阵如下，前一个数字为盖硬币方得益，后一个数字为猜硬币方的得益：
在这里插入图片描述
其实，可以发现猜硬币博弈是个**“零和博弈”**，即不管结果是什么，总得益始终为0，直白点就是“不是你死，就是我亡”。田忌赛马其实也是一个零和博弈，不是齐威王输就田忌输。
这就意味着,猜硬币博弈中没有哪个策略组合的双方策略相互是对对方策略的最佳对策,因此该博弈没有哪个策略组合双方同时愿意接受，因为我们无法像囚徒博弈一样，预测该博弈的结果。

5、夫妻之争

与猜硬币没有最佳对策不同的是，“夫妻之争"博弈中存在两个最佳对策。一对夫妻得到两张时装表演票和同一时间的两张足球赛票。妻子更想去看时装表演而丈夫更想看足球，但又不愿或不能分头行动，双方争执不下，决定投票表决。若投票结果同选时装则去看时装表演，同选足球就去看足球比赛，如选择不一样则哪都不去。
再假设若丈夫与妻子同看时装表演,妻子得益2单位，丈夫得益1单位；若丈夫与妻子都看足球赛丈夫得益3单位，妻子得益1单位；若因为双方选择不同什么都没看成,则双方得益均为0。得益矩阵如下图：
在这里插入图片描述

对于妻子而言：
当丈夫选择“时装”时，妻子的得益分别为2（时装）、0（足球），该情况下，妻子的最优策略为“时装”；
当丈夫选择“足球”时，妻子的得益分别为0（时装）、1（足球），该情况下，妻子的最优策略为“足球”。
对于丈夫而言：
当妻子选择“时装”时，丈夫的得益分别为1（时装）、0（足球），该情况下，丈夫的最优策略为“时装”；
当妻子选择“足球”时，丈夫的得益分别为0（时装）、3（足球），该情况下，丈夫的最优策略为“足球”。

所以，其实该博弈有两个最佳对策（时装，时装）、（足球，足球），任意一个均具有合理性，因此也无法准确预测该博弈的结果。
在经济活动中有许多与夫妻之争相似的博弈问题,制式问题就是典型的例子。电器和电子设备往往有不同的原理或相关技术标准,我们称之为不同的制式。如果生产相关电器或电子设备的厂商采用相同的制式,产品之间就能相互匹配，零配件也可能相互通用，这对于推广各自的产品和在生产经营中进行合作很有帮助。设有两个厂商同时计划引进彩电生产线，而彩电有A、B两种制式,这时候两个厂商之间就有一个选择制式的博弈问题。
在这里插入图片描述

与之类似的，还有猎鹿博弈(stag-hunting)。两个人同时发现1头鹿和2只兔子,如果两个人合力抓鹿，可以抓住这头价值10单位的鹿平分，兔子就抓不到了；如果两个人都抓兔子，各可以抓到1只价值3单位的兔子，鹿会跑掉；如果一个人选择抓兔子，而另一个人选择抓鹿,抓兔子的能抓到1只兔子，抓鹿的人什么也抓不到。再假设两个人来不及商量,必须在瞬间作出决策，这就是一个典型的静态博弈问题。这个博弈的利益关系下图所示：
在这里插入图片描述