纳什均衡
囚徒困境
警察对两个人分别审讯,并且告诉他们政策:
如果两个人都交代坦白,就可以定罪,两个人各判八年。
如果一个人交代另一个不交代,那么一样可以定罪。但是交代的人从宽处罚,批评教育就释放。不交代的人从严处罚,判十年。
如果两个人都不交代,没法定罪,每个人判一年意思一下。
两个人的收益情况如下所示:
首先我们考虑A的决策。A会想,我如何才能获得更大收益呢? 如果B坦白了,那么我坦白就会判8年,我抗拒就会判十年,我应该坦白;如果B抗拒了,我坦白会判0年,我抗拒会判1年,我还是应该坦白。所以最终A会选择坦白。同样,B也会这样想,因此最终纳什均衡点在两个人都坦白,各判八年这里。
显然,集体最优解在两个人都抗拒,这样一来每个人都判一年就出来了。但是,纳什均衡点却不在这里。而且,在纳什均衡点上,任何一个人都没有改变自己决策的动力。因为一旦单方面改变决策,那个人的收益就会下降。