博弈论自学(六)

文章探讨了纳什均衡的不同类型,如帕累托效率、强纳什均衡和抗共谋,以及如何通过风险占优和完美/适当均衡来评估策略。还涉及了相关策略和相关理性化的概念。通过猎鹿博弈和具体案例,深入解析了这些理论在实际决策中的作用。
摘要由CSDN通过智能技术生成

一、多重纳什均衡的比较

  • 帕累托效率标准(收益占优):确定一种改变是否是一种改进的标准,根据这一标准,不损害任何人而能使大多数人(在他们看来)变得更好的改变才是一种改进(经济学解释)。
     

    猎鹿博弈
    猎鹿逮兔
    猎鹿3,30,2
    逮兔2,02,2

    如上表格,经典的猎鹿博弈,纳什均衡选择有:(猎鹿,猎鹿),(逮兔,逮兔),考虑帕累托效率甲乙都选猎鹿带来的收益都提高了,是一种帕累托改进,此时帕累托效率标准下的均衡为:(猎鹿,猎鹿)

  • 强纳什均衡:考虑参与者任意一个集合的子集,当这个子集之外的参与者保持既定策略不变时,子集中的参与者无法改变自身决策使得自身收益提高。

  • 抗共谋纳什均衡:任何一位参与者在此策略组合下不仅没有单独改变自己策略(其他参与者策略不变)的动机,同时没有合伙改变策略(剩下参与者不变)的动机。
     

    三人博弈例子
    丙:策略A丙:策略B
    0,0,10-5,-5,0-2,-2,0-5,-5,0
    -5,-5,01,1,-5-5,-5,0-1,-1,5

    如上表格,该三人博弈的纳什均衡为:(上,左,A)和(下,右,B);而(上,左,A)严格优于(下,右,B),所以帕累托效率标准下的均衡为:(上,左,A);考虑强纳什均衡,对于(上,左,A),在丙选择策略A时,甲乙选择(下,右)优于(上,左),所以(上,左,A)不是强纳什均衡;(下,右,B)任何共谋都不会提升自身收益,所以(下,右,B)是抗共谋纳什均衡

  • 风险占优(仅考虑2✖2博弈进行讨论)
    方法一:假设对手采用各个纳什均衡对应策略的概率相同,计算并比较自己采用纳什均衡对应策略能获得的期望收益,我们说,能带来更高期望收益的策略所对应的纳什均衡“风险占优”于另一个纳什均衡。
     

    5,50,3
    3,03,3

    如上表格,纳什均衡点为:(上,左)和(下,右);考虑方法一,先看甲,乙选择左和右的概率相同,那么甲选择上的期望为2.5,选择下的期望为3,甲会选择下,再看乙,甲选择上和下的概率相同,那么乙选择左的概率为2.5,乙选择右的概率为3,所以(下,右)风险占优

    方法二:偏离损失乘积比较法,即分别计算各个参与者独自偏离当前均衡而遭受的损失,计算偏离损失的乘积(简称“纳什积”),该乘积更大的均衡“风险占优”。

    99,490,0
    0,01,51
    如上图,纳什均衡点为:(上,左)和(下,右);考虑方法一,无法比较;考虑方法二,乙选择左时甲选择下不选上的收益差为99,甲选择上时乙不选左选择右的收益差异为49,两者偏离损失为99*49,同样的右下的偏离损失为51,(上,左)风险占优于(下,右)
  • 聚点均衡:任何能让参与者聚焦到某个均衡的事情(比如公平性、文化、传统等等)都能使他们预期这个均衡将发生,从而实施这个均衡,这类似于自我实现的预言。我们称这样的均衡为聚点均衡或谢林点。
    猎鹿博弈
    猎鹿逮兔
    猎鹿3,30,2
    逮兔2,02,2
    如上表格的经典猎鹿博弈,当打猎的参与者为N人(N>2),每个参与者猎鹿的概率为P,考虑甲,其他人都猎鹿的概率为P^{N-1},其他人中有逮兔的概率为1-P^{N-1},甲猎鹿的期望为:3*P^{N-1}+0*(1-P^{N-1}),可以发现:随着参与者的人数增加,达成合作猎鹿的期望越来越低,风险也越来越大

二、完美均衡与适当均衡

  • 完美均衡:颤抖手完美均衡的基本思想是,在任何一个博弈中,每一个参与者都有一定的可能性犯错误(类似于一个人抓东西时,手的颤抖使其发生偏差而抓不住一样),一个策略组合,只有当它在允许所有参与者都可能犯错误时仍是每一个参与者的最优策略的组合时,才构成一个稳定的均衡。(数学表达略~)

    完美均衡例子
    1,22,3
    2,22,0
    如上表格,纳什均衡点为:(下,左)和(上,右);考虑完美均衡先看(下,左)下和左略微小于2对结果五影响,再看(上,右)若甲略微颤抖微小于2,甲就会选择下而不选择上,此时,(上,右)不是完美均衡,综上:完美均衡点为:(下,左)

    1.每个有限博弈至少有一个(颤抖手)完美均衡;
    2.进一步,在(颤抖手)完美均衡中,没有人使用(严格以及弱)劣策略;
    3.在二人有限策略博弈中,不含弱劣策略的纳什均衡都是(颤抖手)完美均衡。(注意,该命题对于二人以上的博弈不成立。
  • 适当均衡:适当均衡是对完美均衡概念的加强,它对完美均衡概念中的颤抖施加了进一步的限制,其基本思想是,错误(比如劣策略)越严重的行为,发生颤抖的概率越低。
    ABC
    A1,10,0-1,-2
    B0,00,00,-2
    C-2,-1-2,0-2,-2

    如上表格,纳什均衡点为:(A,A)和(B,B),首先(A,A)肯定是完美策略,(B,B)也是完美均衡,因为颤抖后可能选择点是(B,A)和(A,B),和(B,B)一致,考虑适当均衡,看(B,B)若乙发生颤抖,可能颤抖到1也可能到-2,这取决于乙颤抖到A和C的概率,颤抖到A甲选择A,颤抖到C甲选择B,所以取决于乙颤抖到A和C的概率,而可以发现对于乙,C是严格劣于A的,根据适当均衡定义错误发生的越严重,发生颤抖的概率越低,从这个角度乙颤抖选择C是严重的错误行为,发生颤抖的概率越低,则更倾向于A,而乙选择A甲也选择A,所以适当均衡只有:(A,A)

三、相关策略、相关均衡和相关理性化

       考虑参与者之间非相互独立的情况,即参与者选择的概率分布不是相互独立的

AB
A0,05,1
B1,54,4

如上图,考虑相关策略:先看甲,若甲知道自己选A最优,但是不知道乙的选择,假设乙选择A和B的概率为\alpha _{1},\alpha _{2},甲的期望为:\frac{\alpha _{1}}{\alpha _{1}+\alpha _{2}}*0+\frac{\alpha _{2}}{\alpha _{1}+\alpha _{2}}*5,若甲不选最优选B,期望为:\frac{\alpha _{1}}{\alpha _{1}+\alpha _{2}}*1+\frac{\alpha _{2}}{\alpha _{1}+\alpha _{2}}*4,那么有\frac{\alpha _{1}}{\alpha _{1}+\alpha _{2}}*0+\frac{\alpha _{2}}{\alpha _{1}+\alpha _{2}}*5>\frac{\alpha _{1}}{\alpha _{1}+\alpha _{2}}*1+\frac{\alpha _{2}}{\alpha _{1}+\alpha _{2}}*4①;若甲知道自己选B最优,假设乙选择A和B的概率为\alpha _{3},\alpha _{4}能得到对应的概率,得到类似①的不等式,同理看乙也是如此,最后得到四个不等式:\alpha _{2}> \alpha _{1};\alpha _{3}> \alpha _{4};\alpha _{3}> \alpha _{1};\alpha _{2}> \alpha _{4}。最优化结果,参与收益的总和最大:S = \alpha _{1}(0+0)+\alpha _{2}(5+1)+\alpha _{3}(1+5)+\alpha _{4}(4+4),由上面的四个不等式,再加上总概率为1,得到最优解:\alpha _{1}=0;\alpha _{2}=\frac{1}{3};\alpha _{1}=\frac{1}{3};\alpha _{1}=\frac{1}{3};最大为\frac{20}{3}

  • 19
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值