博弈论为解释自私个体之间的交互行为提供了理论框架。
特别地,博弈论还被用于理解个体合作行为和种群进化,揭示底层自私个体之间的竞争和现实生活中广泛存在的合作行为之间看似矛盾实则统一的内在动因。
博弈论模型中的个体也称为参与者,可以在多个策略之间进行选择。一个个体的行为会影响到其他个体,每个个体也能够从与其他个体的互动中获得一定的收益。
博弈论研究理性个体的策略选择,即在其他个体的互动中获得一定的收益。
博弈论中最核心的概念是纳什均衡,是指个体在相互作用过程中达到的一种均衡状态,在这种状态下没有个体可以通过单方面改变自己的策略而增加收益。
博弈模型
1. 囚徒困境博弈
在囚徒困境博弈中涉及两个人和两种策略,因此称其为两人两策略博弈,它包括如下策略组合:
(1)双方都选择合作,记为(C,C)。每个人的收益记为R,即“对双方合作的奖励”。
(2)一方合作而另一方背叛,记为(C,D)或(D,C)。背叛者会获得“背叛的诱惑”T,合作者得到“傻瓜的报酬”S。
(3)双方都选择背叛,记为(D,D)。每个人的收益记为P,即“对双方都背叛的惩罚”。
因此,两人两策略博弈收益矩阵的一般形式可以表示为(R,S;T,P)。
不论对手采取那种策略,选择背叛策略都是最佳的。因此,理性的个体最终会处于相互背叛的状态,这是囚徒困境博弈的纳什均衡状态。但是,此时的收益低于两人同时选择合作时的收益。
2. 雪堆博弈(Snowdrift game,SG)
考虑在一个风雪交加的夜晚,两人开车相向而行,被同一个雪堆所阻。假设铲除这个雪堆使道路通畅需要的代价为c,道路通畅带给每个人的好处为b,b>c。雪堆博弈的收益矩阵为
雪堆博弈存在两个纯纳什均衡:(C,D)和(D,C)。
在不确定对手选择的情况下,个体也可以以概率选择合作,以概率选择背叛。称为双方合作时的损益比。