博弈论自学(五)

一、占优

  • 占优策略:在博弈中,如果不管其他参与者选择什么策略,某个参与者的特定策略都优于或者至少不劣于其他任何策略,那么,我们就说这个特定策略是该参与者的占优策略。
     

    囚徒困境案例
    囚犯乙
    坦白不坦白
    囚犯甲坦白-5,-50,-8
    不坦白-8,0-1,-1
                          如上图囚徒困境,通过划线法可以知道(坦白,坦白)是占优策略
         
    案例二:某小区有A、B、C三户,每户可以自主决定是否为大家提供一件公共产品,假设每件公共产品给每户带来的效用为100元,而其成本为150元。各户会如何抉择?
    C(提供公共产品)C(不提供公共产品)
    B(提供公共产品)B(不提供公共产品)B(提供公共产品)B(不提供公共产品)
    A(提供公共产品)150,150,15050,200,50A(提供公共产品)50,50,200-50,100,100
    A(不提供公共产品)200,50,50100,100,-50A(不提供公共产品)100,-50,1000,0,0

    如上图,A会选择的情况(A不提供,B提供,C提供),(A不提供,B不提供,C提供),(A不提供,B提供,C不提供),(A不提供,B不提供,C不提供);B会选择的情况(A提供,B不提供,C提供),(A不提供,B不提供,C提供),(A提供,B不提供,C不提供),(A不提供,B不提供,C不提供);C会选择的情况(A提供,B提供,C不提供),(A不提供,B提供,C不提供),(A提供,B不提供,C不提供),(A不提供,B不提供,C不提供);综上三者共同选择是:(A不提供,B不提供,C不提供)

二、可理性化

  • 永非最优反应:如果参与者的某一策略对于自身的任何信念都不是最优反应,那么,就称该策略是永非最优反应(这里可以结合之前的两人博弈,把自身的任何信念看成对手,那么作为理性人博弈者,不应当采用永非最优反应

  • 可理性化均衡:参与者具有理性且信息充分的情况下所达到的一种平衡状态。在这种状态下,每个参与者都会根据其个人利益做出最佳选择,而且没有人可以通过改变自己的策略来获得更好的结果(从定义可以看出这个均衡是纳什均衡的一种形式
    可理性化例题
    DE
    A4,20,3
    B1,11,0
    C3,02,2

    上述表格中以甲的策略A为例,其是否是可理性化的?如果甲选择策略A,他此时认为乙肯定会选择D,这样甲才能达到最优效应,而乙选择D时甲的最优选择是B,不论乙选择D还是E对于甲效用都是1都不是最大的,也就是说不论乙作何选择,甲都不会选择B,所以甲的策略A不是可理性化的。(通俗点说:可理性化需要双方一直能递推最优选择,对于有限策略都是循环)

三、重复剔除严格劣策略

  • 严格劣策略:一种策略对于某个博弈者来说,无论其他博弈者采取何种策略,都会比其他任意一种策略的收益低,称为严格劣策略;若博弈者的该策略,在其他博弈者采取任何策略都不高于其他策略的收益,则称为严格弱劣策略(数学表达略~)

  • 重复剔除严格劣策略:首先从某一个参与者的策略集中剔除一个严格劣策略,再重新考察各个参与者剩下的策略中哪些是严格劣策略并剔除其中之一,不断重复这一过程知道无法进一部剔除为止。如果每个参与者都仅剩一个策略,则最后得到的策略组合就称为重复剔除的占优均衡
     

    重复剔除严格劣策略例题一
    1,01,20,1
    0,30,12,0

    如上表格,找到重复剔除的占优均衡策略组合。先看甲,上和下不存在严格劣策略,再看乙,乙选择右严格劣于中,在剩下的组合中甲选择下严格劣于上,在甲只能选择上的情况下,乙选择左严格劣于选择中,最后得到重复剔除的占优均衡策略组合:(上,中)
    上面这个例题有n阶共识的思想:1.零阶理性共识:每个人都是理性的,但不知道其他人是否理性。2.一阶理性共识:每个人是理性的,并且知道其他人也都是理性的,但不知道其他人是否知道自己是理性的。3.二阶理性共识:每个人是理性的,也知道其他人都是理性的而且知道其他人知道自己是理性的,但不知道其他人是否知道自己知道他们是理性的。(以此类推。。。)
     

    重复剔除严格劣策略例题
    B1B2B3B4
    A15,100,111,2010,10
    A24,01,12,020,0
    A33,20,44,350,1
    A42,930,920,91100,90

    如上表格,找到重复剔除的占优均衡策略组合。思路一样,先看甲,没有弱严格列策略,在看乙,B4严格劣于B2,删除B4;删除B4后,A4严格劣于A2,删除A4;删除A4后B1严格劣于B2,删除B1;删除B1后A1严格劣于A2删除A1;删除A1后B3严格劣于B2删除B3;删除B3后A3严格劣于A2,最后重复剔除的占优均衡策略组合为(A2,B2)(如果不要求严格劣策略,而是弱劣策略,途径就不是唯一的了)

四、纳什均衡与重复剔除的占优策略的关系

  1. 纳什均衡不会被重复剔除严格劣策略过程所剔除(从上面的例子和定义也能看出);

  2. 如果重复剔除严格劣策略过程最终只剩下唯一的策略组合,那么这策略组合为该博弈唯一的纳什均衡(可以理解为1的延申);

  3. 重复剔除弱劣策略过程有可能剔除弱纳什均衡,但不会剔除严格纳什均衡

    2,10,0
    1,31,3
    上述例子验证3;纳什均衡点是(下,右);而重复剔除弱劣策略得到的弱占优均衡策略组合为(上,左)不是纳什均衡点
  4. 一个有意思的博弈实验

            省委三名常委(1、2、3)要就三个备选方案(A、B、C)进行投票。采用多数票制,但为了避免出现僵局,现在由常委1担任主席,主席的权力体现在:如果三个人的投票结果没有哪个方案胜出,那么作为主席的1就拥有最终决定权。各人的偏好顺序如下表所示。以上信息为共同知识。如果你是参与者之一,你会如何投票,最终哪个方案被选中呢?
    第一偏好第二偏好第三偏好
    主席ABC
    常委2CAB
    常委3BCA

            如上表格,先分析主席的选择,把所有常委2和常委3的选择列出来:如果常委2和常委3选择相同的方案,此时主席选择A、B、C无差异,他已经改变不了选票;如果常委2常委3选择BC,主席选择A;如果常委2常委3选择AB,那么主席可以选择A和C(可以选C是因为没人胜出,主席可以再选A);如果常委2常委3选择AC,那么主席可以选择A和B可以选B是因为没人胜出,主席可以再选A),综上:A在任何情况下都最优,主席肯定选择A。再看常委2,常委2知道主席肯定选择A,如果常委3选择B,常委2可以选择A和C(不管选哪个结果都是A,选C不同票还是主席选,结果还会是A);如果常委3选择A,常委2选A、B、C无差异;如果常委3选择C,常委2也会选择C;综上:常委2肯定选择C;同理,常委3肯定选择C。这么最后C被选中,(这种情况下,上级要做到信息不对成才行😄)

  • 20
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值