博弈论学习(二)——完全信息静态博弈

这一篇主要介绍非合作博弈中,完全信息静态博弈的相关知识。

切记非合作博弈的条件:参与人具有足够智力且极端个人主义,即以自己的效用作为唯一的衡量标准

要理解完全信息静态博弈,首先要了解以下2个概念:

完全信息:博弈过程中没有不确定的信息,即所有信息参与人都是已知的;

静态:博弈过程没有先后顺序,如摇色子,谁先摇,谁后摇都没有意义,但是一块开,就等同于同时行动;

有了博弈模型,最主要的是找到均衡,即均衡是博弈模型的解,也是对参与人策略的理性预测

完全信息静态博弈中主要包含以下几种基本均衡,它们之间的关系如下图所示:

 

                           

                                                                   三类均衡的关系

1. 占优均衡

    相关概念:上策:某种策略的收益比任何其它策略都要高,且其他参与人做出任何选择时,此参与人的这种优势始终存在,则称为此策略为上策。

    均衡特征:所有参与人都有上策,此时都是上策的战略组合称为占优均衡。换句话说,每个人都有一个最好选择,都做自己最好的选择,博弈就进入了一种均衡状态。

    存在性:不一定存在,如猜拳游戏就没有上策。

2. 劣策略反复消去均衡

    相关概念:劣策略:某种策略的收益在任何情况下都不会高于其它任何一种策略,则此策略称为劣策略(下策)。

    均衡特征:基于理性人不会做出劣策略的原理,反复消去劣策略,如果最后每个参与人都只有剩下了唯一策略,则剩下的策略组合称为劣策略反复消去均衡。

   存在性:占优均衡存在,则劣策略反复消去均衡则一定存在;反之不然。

   应用例子:智猪博弈

3. 纳什均衡

   相关概念:

   均衡特征:任何参与人单方面偏离均衡不会带来收益的增加

   存在性:劣策略反复消去均衡一定是纳什均衡;反之则不然。所有博弈不一定存在纳什均衡。

   一致性:如果参与人通过预测均衡,从而调整策略来进一步扩大收益,导致结果改变,被称为预测不具有不一致性。上述方法在纳什均衡中是不可取的,因为在纳什均衡中,改变策略无法提升自己的收益。所以纳什均衡具有一致性。

   多重纳什均衡:即博弈过程中出现多个纳什均衡。多个纳什均衡的地位是平等的,因此需要依赖模型以外的信息,如对理性要求的降低、事先的协商等。

   解决方法:划线法、极值法、反应函数。其中划线法适用于策略空间有限的情况,极值法适用于策略空间无限的情况。简而言之,划线法是在矩阵中控制变量查找策略交点,微积分法是通过收益函数对策略求导=0,来查找收益的极大值点,可以把策略当成x,收益当成y,想象一下坐标系。反应函数是划线法的扩展,即固定某一参与人的策略,获得另一个参与人的反应函数,反之亦然,两个函数的交点就是纳什均衡。

   应用例子:性别战模型、库诺特竞争模型

 

ps:上述均衡均涉及到支付的比较排序,即> 还是 ≧ 。其中>表示严格, ≧表示非严格,他们之前的关系如下:

严格占优均衡-->强纳什均衡

非严格占优均衡-->弱纳什均衡

严格下策反复消去均衡-->强纳什均衡

非严格下策反复消去均衡-->有可能消去纳什均衡

 

混合策略纳什均衡

概念:策略可以分为混合策略纯策略。以抛硬币为例,硬币为正、为反是两个纯策略,要么1,要么0。而“1/2的概率为正、1/2的概率为反”则是一个混合策略,由此可以推断,混合策略空间是无限的。

通常,以P的概率选择某个纯策略的策略称为混合策略,并且大多会直接用P来表示。

解决方法:极值法、均衡法。极值法不再赘述。均衡法是指观察参与人的收益函数,即控制参与人1的纯策略,求参与人2的混合策略期望,通过多项式合并,为了获得混合策略纳什均衡,必须保证每种纯策略下的混合策略期望相等,否则,极度理性和自私的参与人肯定会直接选择混合策略期望较高的纯策略。

应用例子:社会福利博弈

 

定理一:每一个有限博弈,不是混合策略纳什均衡,就是纯策略纳什均衡。

定理二:几乎所有的有限博弈都存在奇数个纳什均衡。

定理三:如果一个有限博弈有两个纯策略纳什均衡,则至少有一个混合策略纳什均衡。

定理四:一般情况下,混合策略纳什均衡都存在,具有较强的普遍性。

 

 

  • 0
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值