总第211篇/张俊红
在前面我们讲过帕累托最优,这一篇我们来讲讲比较类似的一个概念就是纳什均衡,纳什均衡又称为非合作博弈均衡,与非合作博弈均衡相对应的还有合作博弈均衡。那什么是非合作博弈均衡,什么又是合作博弈均衡呢?给大家举个很经典的例子《囚徒困境》,大家看完例子就会明白是怎么回事:
以前有两个小偷AB集体作案,然后被警察捉住了。
警察对两个人分开审讯,并且提前告诉了他们审讯政策:如果两个人都坦白交代,就可以定罪,两个人各判八年。如果一个人交代而另外一个人不交代,那么一样是可以定罪的。但是交代的人会被从宽处罚,思想教育下就可以释放。不交代的人则从严处罚,判刑十年。如果两个人都不交代,则没法定罪,每个人只判一年。
首先我们考虑小偷A会怎么选?A会想,我如何才能获得更大收益呢?如果B坦白了,那么我坦白就会判8年,我抗拒就会判十年,我应该坦白;如果B抗拒了,我坦白会判0年,我抗拒会判1年,我还是应该坦白。所以最终A会选择坦白。同样,B也会这样想。所以最后两个人都会被判刑8年。这就是纳什平衡,在策略博弈过程中每个人都是向着自己利益最大化的方向去做决策。
你可能会想,他们明明可以都只被判刑1年的,但是这不是纳什均衡点,所以最后的也不可能是这个结果。纳什均衡点上两个的利益与损失是一样的,在这个平衡点上只要有一方改变了决策,那么他自身的收益就会下降。
还有一种战术性纳什均衡,田忌赛马的故事大家应该都听过,如果是按照纳什均衡的原则来赛马的话,双方可能最后是平局的结果,因为双方都会朝着自己利益最大化的方向,也就是赢的这个方向去做选择,所以都会派出最厉害的马来参赛。但是田忌首先打破了这个均衡点,以自己短暂的利益受损,获取长期的利益获胜。
还有很多战术性纳什均衡的故事,比如胡雪岩卖米,有兴趣的同学也可以去了解下。