如何计算近似纳什均衡_讲讲什么是纳什均衡

a0205b88210ae9706e6963dd5e9e3eb1.png

总第211篇/张俊红

在前面我们讲过帕累托最优,这一篇我们来讲讲比较类似的一个概念就是纳什均衡,纳什均衡又称为非合作博弈均衡,与非合作博弈均衡相对应的还有合作博弈均衡。那什么是非合作博弈均衡,什么又是合作博弈均衡呢?给大家举个很经典的例子《囚徒困境》,大家看完例子就会明白是怎么回事:

以前有两个小偷AB集体作案,然后被警察捉住了。

警察对两个人分开审讯,并且提前告诉了他们审讯政策:如果两个人都坦白交代,就可以定罪,两个人各判八年。如果一个人交代而另外一个人不交代,那么一样是可以定罪的。但是交代的人会被从宽处罚,思想教育下就可以释放。不交代的人则从严处罚,判刑十年。如果两个人都不交代,则没法定罪,每个人只判一年。

首先我们考虑小偷A会怎么选?A会想,我如何才能获得更大收益呢?如果B坦白了,那么我坦白就会判8年,我抗拒就会判十年,我应该坦白;如果B抗拒了,我坦白会判0年,我抗拒会判1年,我还是应该坦白。所以最终A会选择坦白。同样,B也会这样想。所以最后两个人都会被判刑8年。这就是纳什平衡,在策略博弈过程中每个人都是向着自己利益最大化的方向去做决策

你可能会想,他们明明可以都只被判刑1年的,但是这不是纳什均衡点,所以最后的也不可能是这个结果。纳什均衡点上两个的利益与损失是一样的,在这个平衡点上只要有一方改变了决策,那么他自身的收益就会下降。

还有一种战术性纳什均衡,田忌赛马的故事大家应该都听过,如果是按照纳什均衡的原则来赛马的话,双方可能最后是平局的结果,因为双方都会朝着自己利益最大化的方向,也就是赢的这个方向去做选择,所以都会派出最厉害的马来参赛。但是田忌首先打破了这个均衡点,以自己短暂的利益受损,获取长期的利益获胜。

还有很多战术性纳什均衡的故事,比如胡雪岩卖米,有兴趣的同学也可以去了解下。

0781ea7c03c15a7c2194cfe64fc08453.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值