0 囚徒困境:
假定有两个犯罪嫌疑人共同作案。警察抓住他们以后,分开拘押,并告诉他们:可以选择坦白,或是不坦白;如果一个人坦白,而另一个人不坦白,则坦白的一方会被立即释放,而不坦白的一方被判10年;如果两人都坦白,则会每人各判8年;如果两人都抵赖,因证据不足,则每人在关押1年后释放。那么,这两个犯罪嫌疑人该如何选择呢?
现在我们来看参与人甲和乙会如何决策。我们假设参与人是理性的,都不想坐牢,能少坐牢尽量少坐牢。我们先考虑甲的选择,他面对的问题是:如果乙坦白的话,自己坦白判8年,不坦白判10年,那么坦白比不坦白好;如果乙不坦白,自己坦白会被立即释放,不坦白则判1年,坦白还是比不坦白好。因此,不论对方坦白不坦白,甲或乙自己的最优选择都是坦白。
占优均衡:一般来说,由于每个参与人的效用依赖于所有人的选择,因此每个人的最优选择(战略)也依赖于所有其他人的选择(战略)。但由囚徒困境我们可以看出,一个人的最优选择并不依赖于他人的选择。这样的最优战略,被称为“占优战略”。由所有参与人的占优战略构成的战略组合被称为“占优均衡”。
占优战略均衡的出现只要求所有人都是理性的,但不要求每个参与人知道其他人是否理性。
囚徒困境博弈有占优均衡,所以其结果很容易预测。
“囚徒困境”表明个人理性与集体理性的冲突。这样的例子有很多:寡头竞争,军备竞赛,团队生产中的劳动供给,公共产品的供给,等等。许多的制度就是为了解决“囚徒困境”而存在的。
私人产品是志愿购买的,但公共产品可能需要强制购买;税收制度就是保证公共产品的生产,解决公共产品生产上的“囚徒困境”。
囚徒困境的一般表示: