博弈论自学(七)

威胁的可信性与子博弈精炼纳什均衡

一、威胁的可信性

  • 威胁的可信性定义:动态博弈中先行为的博弈方是否该相信后行为的博弈方会采取对自己有利的或不利的行为
    例子(法律诉讼):小明和小张出现利益纠纷,若小明指控小张,小明需要支付指控成本c,若不指控双方收益都为0;当小明指控小张时,小张选择线下调节,小张支付小明a解决,小明可以选择接受,也可以选择不接受,若不接受,小明起诉小张,小明起诉的成本为d,小张的成本为e,小明成功的概率为p。若小张威胁小明线下解决,这就要看小明胜诉的概率,在不同阶段收益与成本之间的考量

二、子博弈精炼纳什均衡

  • 子博弈:指的是在一个大博弈过程中能够被抽象出来、独立进行分析的小规模博弈过程(从博弈任何一个节点开始一直到博弈结束都可以看作一个子博弈);在博弈树中,子博弈通常是对应于树上某个节点的子树。

  • 子博弈精炼纳什均衡:针对一个复杂博弈过程中的某个子博弈,通过逐步剔除那些在子博弈中没有意义或不合理的策略,最终得到一个在子博弈中的纳什均衡解。这个过程中,参与者不断修正他们的策略,直到达到一个无法通过单方改变策略而获益的状态。

  • 一次偏离性质:没有一个参与者在轮到他是第一个行动者的任何子博弈中可以通过改变自己在该子博弈起始处的行动而提高自己的收益,给定其他参与者的策略和自己策略的其他部分不变。(在有限多阶段可观察行动博弈或者在无限连续多阶段可观察行动博弈中,某一策略组合构成子博弈精炼纳什均衡的充分必要条件是满足一次偏离性质

  • 逆向归纳法:在完全且完美的动态博弈中,先行为的理性博弈人,在前面阶段选择策略时,必然会考虑后行博弈人在后面阶段中将会怎样选择策略。因而,只有在博弈的最后一个阶段,不再有后续阶段牵制的情况下,博弈人才能作出明智的选择。在后面阶段博弈人选择的策略确定后,前一阶段的博弈人在选择策略时也就相对容易。(逆向归纳法排除了不可信的威胁或承诺

  • 例题一:经典案例(海盗分金
    5个海盗A、B、C、D、E分100个金币,先由A提出分金币的方案,大家进行票选。如果半数及以上的海盗同意,那就按A的方案来分配金币。否则A就会被丢入大海喂鲨鱼,B继任为船长,依次下去,由B、C、D、E继任为船长并提出方案,提议未通过则被丢下船,直到有一个方案投票通过或只剩一个海盗为止。海盗之间直接不会事先勾结,如果船长的方案中和其他人可能提的福利一样,那海盗也不会投赞成票。那么A该怎么做?
    解答:海盗分金属于完全完美动态博弈,用逆向归纳法就简单很多。
    首先先看E,若只剩下E,那么E拿走100金币,若E没有全部拿走,那必然D还在;
    再看D,当只剩下D和E时,D已经占半数投票,此时D分走100金币,那么E肯定不会否定前面A,B,C中的全部方案;
    再看C,若只剩下C、D、E三个人C只要让D和E中一个同意他的方案就可以,D肯定不同意,因为C喂鲨鱼D就能拿走100金币,这样C给E 1金币即可,对于E来说有1金币肯定比没有好,此时,C拿走99金币,E拿走1金币
    再看B,若剩下B、C、D、E,B只要让C、D、E中的一个同意他的方案即可,C肯定不同意,B喂鲨鱼C能拿走99金币,B肯定找D或者E,选择D比E好,因为D只有同意才会拿到金币,否则一个金币拿不到,此时,B拿走99金币,D拿走1金币
    再看A,A要让两个人同意他的方案,B肯定不同意,选择C、E是最好的,不然A喂鲨鱼只有B和D能得到金币,此时,A拿走98金币,C拿走1金币,E拿走1金币
    在这种情况下:谁占据先导权,往往能获得绝对的利益。

  • 例题二:子博弈精简纳什均衡点例题
    (此例子纯属虚构)A向B借笔记备考,若B不借给A,B可以省时间可以拉开与A的分数,A得不到收益,B得到2的收益;若B借给A,A可以请B吃顿饭,A的考试得到提高,A和B的收益都是3,当然A也可以不给B任何东西,若B心态不好爆炸了,把笔记撕了,两人的收益都为-5,若B心态好没爆炸,A的收益为0,B的收益为4;求A和B的子博弈纳什均衡。

    大概是上图这样,用一次偏离性质来算:逆向归纳法,最后一层图中漏了个不炸的,对于B肯定选择不炸,往上推A肯定选择不分,因为不分不炸的收益大于分的收益,选择分会发生偏离,再往上,B在知道若选择借A肯定选择不分的情况,B借的收益小于不借,所以B选择不借;子博弈精简纳什均衡为:(A,B)对应(不分,(借,不炸))

  • 12
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值