博弈论笔记(1)—— 完全信息博弈(施工中)

基本假设

  1. 玩家只关心自己的回报(效益)。
  2. 玩家是理性的,如果可以,他们会在所有可选项目中选择能最大化他们效益的。
  3. 玩家不受智力和其他选择上的限制。

即,在该假设下,玩家追求效用最大化

一般形式(Strategic form)

  1. A set of players N = {1,…,n}.
    代表玩家的集合。

Ex: N = {1,2}.

  1. A set of pure strategies Si per player i ∈ N combined to form the strategy space S = S1 ×S2 ×···×Sn. An element s ∈S is called a strategy profile.
    纯策略:一个确定性的行动计划。
    Si :玩家i的纯策略集,其中包含了玩家i的所有纯策略。
    所有玩家的纯策略集组合成为博弈的策略空间。

Ex: Si = {enter, don’t enter} are identical for both players, i.e., S = S1 ×S2 = Si2 .

  1. A set of expected utility payoff fns ui(s ∈ S): ui: S→R. We write u(s) = u1(s),…,un(s).
    效用函数集,在确定策略下玩家可获得的收益。

Ex: discrete values ui(e,e) = 1.5, ui(de,de) = 0, i∈{1,2}, and u1(e,de) = 3 = u2(de,e), u1(de,e) = 0 = u2(e,de).

通过以上 {N,S,u} 可以唯一确定某一特定的静态博弈,我们把它称作gsf。

信息矩阵

便于直观展示博弈的内容,矩阵位于2维空间,适用于2名玩家的博弈。
3名玩家的博弈用cube或者多个矩阵表示。

dc
d0,04,-1
c-1,43,3
  1. 其中,列表头代表玩家1的纯策略,行表头代表玩家2的纯策略。
  2. 矩阵中每一格对应着相应的玩家1和玩家2的策略组合(strategy profile),我们将之称作结果(outcome)。
  3. 每个结果形如 (u1,u2) ,分别代表着玩家1和玩家2的期望效益。

对称博弈(Symmetry)

博弈的结果只取决于策略组合中的策略,而与该策略是哪位玩家选择的无关。

在对称博弈中,可以通过对一名玩家的策略研究,得到适用于所有玩家的结果。

混合策略

A mixed strategy of player i is a probability distribution σi over i’s pure strategy space Si. We denote by Σi the space of i’s mixed strategies and the full space by Σ = Σ1 ×…×Σn.
混合策略是Si上的一个概率分布。

Ex: S1={a,b},σ1=(σ1(a),σ1(b)),σ1(a)+σ1(b)=1

严格劣势策略

A strategy si ∈Σi is called strictly dominated for player i if there is a σ′ i ∈ Σi such that
ui(σ′ i,s−i) > ui(si,s−i) for all s−i ∈ S−i
(⋆) where S−i = S1 ×…×Si−1 ×Si+1 ×…×Sn.
如果在其他玩家采取任何策略时,某策略的效用永远低于某另一个确定的策略,则称该低效用的策略为严格劣势策略。

重复剔除劣战略

  • 一名理性的玩家永远不会选择严格劣战略

(I)ESDS:(iterative)elimination of strictly dominated strategies
(严格)剔除劣战略

占优可解(dominance solvable):如果严格劣势策略的迭代消除(IESDS)过程中幸存下唯一博弈组合sES,则称该博弈为占优可解的。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值