小猪躺着大猪跑(博弈论的诡计)

 

公元前529年,晋国在平丘召集天下诸侯,举行会盟。

 

晋君为了夸耀自己作为盟主的实力,用兵车四千乘围在会场的四周,一眼望去,车马排布整齐。旌旗摇动,仪仗鲜明。晋君端坐会场中央,看着依次就座的各国使臣,心中禁不住暗暗得意。

 

各国使臣依次坐定以后,郑国代表子产劈头就向晋君提出减少会费分摊的问题。他说:“自古以来,缴纳给天子的献款都依照爵位的等级而定,只有京畿地区的诸侯必须缴纳超出等级以上的献款。我们郑侯的等级是伯男,却和您一样,负担起公侯级的义务,实在太不合理了,务必请减少献款。近年来,诸侯息兵,致力于修睦邦交,每月都有使团往来交流,光是这些费用就不少,又要分摊这么重的会费,像我们这般小国实在负担不起。举行会盟的目的,无非是为了维持小国的生存,会费的负担若使小国灭亡,岂不是有违会盟的宗旨吗?务请慎重考虑。”

 

这样的理由提得有理有据,确实也反映了当时郑国权利与义务不相符的现实。但是晋国担心其他小国也会提出同样的要求,因此一口拒绝。然而,子产作为一名出色的外交家,惯用死缠烂打的交涉手法。他与晋国大夫从中午一直争论到傍晚,仍然僵持不下,时间都被花在这桩议案上面,而会盟的主旨却还根本没有接触,最后晋君没办法,只好接受了子产的这项要求。

 

在上面的故事中,子产用来说明郑国要减少献款的理由就是:郑侯的等级是伯男,却按公侯的级别承担义务,这是不合适的。其实他在这里所运用的理论,用现代人的眼光来看,是一种可以称为“智猪博弈’’的博弈策略。

 

假设猪圈里有两头猪同在一个食槽里进食,一头大猪,一头小猪。我们假设它们都是有着认识和实现自身利益的充分理性的“智猪”,猪圈两头距离很远,一头安装了一只控制饲料供应的踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一头就会有相当于10份的饲料进槽,但是踩踏板以及跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的饲料。

 

两头猪可以选择的策略有两个:自己去踩踏板或等待另一头猪去踩踏板。如果某一头猪做出自己去踩踏板的选择,不仅要付出劳动,消耗掉2份饲料,而且由于踏板远离饲料,它将比另一头猪后到食槽,从而减少吃到饲料的数量。我们假定:若大猪先到(即小猪踩踏板),大猪将吃到9份的饲料,小猪只能吃到1份的饲料,最后双方得益为【9,-1】;若小猪先到(即大猪踩踏板),大猪和小猪将分别吃到6份和4份的饲料。最后双方得益为【4,4】;若两头猪同时踩踏板,同时跑向食槽,大猪吃到7份的饲料,小猪吃到3份的饲料,即双方得益为【5,1】;若两头猪都选择等待,那就都吃不到饲料,即双方得益均为0。

 

智猪博弈的收益矩阵可以用下表所示、表中的数字表示不同选择下每头猪所能吃到的饲料数量减去前去踩踏板的成本之后的净收益水平。

                  大猪行动             大猪等待

小猪行动        5, 1                    9, -1

小猪等待        4, 4                    0, 0

智猪博弈的收益矩阵

 

那么这个博弈的均衡解是什么呢?这个博弈的均衡解是大猪选择去踩踏板,小猪选择等待,这时,大猪和小猪的净收益水平均为4个单位。这是一个“多劳不多得,少劳不少得”的均衡。

 

在找出上述智猪博弈的均衡解时,我们实际上是按照“重复剔除严格劣势策略”的逻辑思路进行的。这一思路可以归纳如下:首先找出某参与人的严格劣势策略,将它剔除,重新构造一个不包括已剔除策略的新博弈;然后,继续剔除这个新的博弈中某一参与人的严格劣势策略;重复进行这一过程,直到剩下唯一的策略组合为止。剩下这个唯一的策略组合,就是这个博弈的均衡解,称为“重复剔除的占有策略均衡”。

 

在智猪博弈收益矩阵中可以看出:小猪踩踏板其能得到l份甚至损失1份,不踩踏板反而能得到4份。对小猪而言,无论大猪是否踩动踏板,小猪采取“搭便车”策略,也就是舒舒服服地等在食槽边,都是最好的选择。

 

 

                  大猪行动             大猪等待

小猪行动        5, 1                    9, -1

小猪等待        4, 4                    0, 0

剔除后的智猪博弈的收益矩阵

 

 

由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待就吃不到;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强,只好为自己的4份饲料不知疲倦地奔忙于踏板和食槽之间。

 

也就是说,无论大猪选择什么策略,选择踩踏板对小猪都是一个严格劣势策略,我们首先加以剔除。在剔除小猪踩踏板这一选择后的新博弈中,小猪只有等待一个选择,而大猪则有两个可供选择的策略。在大猪这两个可供选择的策略中,选择等待是一个严格劣势策略,我们再剔除新博弈中大猪的严格劣势策略等待。剩下的新博弈中只有小猪等待、大猪踩踏板这一个可供选择的策略,这就是智猪博弈的最后均衡解,达到重复剔除的优势策略均衡。

 

智猪博弈与囚徒困境的不同之处在于:囚徒困境中的犯罪嫌疑人都有自己的严格优势策略;而智猪博弈中,只有小猪有严格优势策略,而大猪没有。

 

在一场博弈中,如果每个参与人都有严格优势策略。那么严格优势策略均衡是合乎逻辑的。但是在绝大多数博弈中。这种严格优势策略均衡并不存在。而只存在重复剔除的优势策略均衡。所以,智猪博弈听起来似乎有些滑稽,但是它却是一个根据优势策略的逻辑找出均衡的博弈模型。

 

智猪博弈模型可以用来解释为什么占有更多资源者,比如本章开头的故事中的晋国,必须承担更多的义务。这样的现象在当代国际和国内政治生活中都十分普遍。

 

1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看REaDME.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值