博弈论之:敌不动我不动

 A. 帕累托最优

帕累托改进是指,这个改进能在不伤害任何一个人的利益的同时,使至少一个人的境遇变好。

如果一个局面已经好到没有帕累托改进的余地了,就是帕累托最优。

思考:囚徒困境中,如果对方选择不招供,那么此时本方若选择不招供,对方就会少罚,这就是一个帕累托改进。

生活中,越low的人越见不得身边的人好,假使某项改进不影响其本人利益但会使别人获益,估计他也是不会推动的。

B. 压倒性策略

压倒性策略是指,不管对手怎么做,这项策略对你来说都是最优的。

思考:囚徒困境中,虽然最好的结果是两人都不招供,但是 背叛才是本方压倒性策略,因为:如果对方招供,本方最好的策略是招供(不然罪加一等);如果对方不招供,本方的最好策略也是招供(无罪释放)。

此时,双方压倒性策略都是招供,这个结果虽然不是帕累托最优,但是这个结果是稳定的,任何一方都不会单方面改变策略(除非双方约定一起不招供,但这显然无法实现)。

C. 纳什均衡

纳什均衡是指,如果各方选择了这么一组策略,那么各方将会被“锁定”,没有任何一方愿意单方面改变自己的策略——要变要一起变,我自己不可能先变。

思考:在孩子教育竞赛这场囚徒困境中,也许家长都追求素质教育、不唯分数论,不狂上补习班才是最优的局面,但是谁都不愿意先改变当下唯一追求分数的策略,这是一个纳什均衡,也是一个多输的局面。

地缘政治斗争中,相关国家的军备竞赛也是一种纳什均衡,大家的压倒性策略都是备战,这也是一个多输局面,但是谁敢先放松呢?

“人质困境”也是一个纳什均衡——如果大家联合起来就一定会打败歹徒,但是谁来带头反抗呢?枪打出头鸟啊。

 

技术视频号,纯分享
我的视频号,分享技术

d

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值