基本假设
- 玩家只关心自己的回报(效益)。
- 玩家是理性的,如果可以,他们会在所有可选项目中选择能最大化他们效益的。
- 玩家不受智力和其他选择上的限制。
即,在该假设下,玩家追求效用最大化。
一般形式(Strategic form)
- A set of players N = {1,…,n}.
代表玩家的集合。
Ex: N = {1,2}.
- A set of pure strategies Si per player i ∈ N combined to form the strategy space S = S1 ×S2 ×···×Sn. An element s ∈S is called a strategy profile.
纯策略:一个确定性的行动计划。
Si :玩家i的纯策略集,其中包含了玩家i的所有纯策略。
所有玩家的纯策略集组合成为博弈的策略空间。
Ex: Si = {enter, don’t enter} are identical for both players, i.e., S = S1 ×S2 = Si2 .
- A set of expected utility payoff fns ui(s ∈ S): ui: S→R. We write u(s) = u1(s),…,un(s).
效用函数集,在确定策略下玩家可获得的收益。
Ex: discrete values ui(e,e) = 1.5, ui(de,de) = 0, i∈{1,2}, and u1(e,de) = 3 = u2(de,e), u1(de,e) = 0 = u2(e,de).
通过以上 {N,S,u} 可以唯一确定某一特定的静态博弈,我们把它称作gsf。
信息矩阵
便于直观展示博弈的内容,矩阵位于2维空间,适用于2名玩家的博弈。
3名玩家的博弈用cube或者多个矩阵表示。
d | c | |
---|---|---|
d | 0,0 | 4,-1 |
c | -1,4 | 3,3 |
- 其中,列表头代表玩家1的纯策略,行表头代表玩家2的纯策略。
- 矩阵中每一格对应着相应的玩家1和玩家2的策略组合(strategy profile),我们将之称作结果(outcome)。
- 每个结果形如 (u1,u2) ,分别代表着玩家1和玩家2的期望效益。
对称博弈(Symmetry)
博弈的结果只取决于策略组合中的策略,而与该策略是哪位玩家选择的无关。
在对称博弈中,可以通过对一名玩家的策略研究,得到适用于所有玩家的结果。
混合策略
A mixed strategy of player i is a probability distribution σi over i’s pure strategy space Si. We denote by Σi the space of i’s mixed strategies and the full space by Σ = Σ1 ×…×Σn.
混合策略是Si上的一个概率分布。
Ex: S1={a,b},σ1=(σ1(a),σ1(b)),σ1(a)+σ1(b)=1
严格劣势策略
A strategy si ∈Σi is called strictly dominated for player i if there is a σ′ i ∈ Σi such that
ui(σ′ i,s−i) > ui(si,s−i) for all s−i ∈ S−i
(⋆) where S−i = S1 ×…×Si−1 ×Si+1 ×…×Sn.
如果在其他玩家采取任何策略时,某策略的效用永远低于某另一个确定的策略,则称该低效用的策略为严格劣势策略。
重复剔除劣战略
- 一名理性的玩家永远不会选择严格劣战略
(I)ESDS:(iterative)elimination of strictly dominated strategies
(严格)剔除劣战略
占优可解(dominance solvable):如果严格劣势策略的迭代消除(IESDS)过程中幸存下唯一博弈组合sES,则称该博弈为占优可解的。