博弈论笔记（1）—— 完全信息博弈（施工中）

最新推荐文章于 2023-10-31 22:01:24 发布

ka1eidoscope

最新推荐文章于 2023-10-31 22:01:24 发布

阅读量1k

点赞数 1

分类专栏：笔记文章标签：博弈论

本文链接：https://blog.csdn.net/qq_34112576/article/details/96658244

版权

笔记专栏收录该内容

3 篇文章 0 订阅

订阅专栏

基本假设

玩家只关心自己的回报（效益）。
玩家是理性的，如果可以，他们会在所有可选项目中选择能最大化他们效益的。
玩家不受智力和其他选择上的限制。

即，在该假设下，玩家追求效用最大化。

一般形式（Strategic form）

A set of players N = {1,…,n}.
代表玩家的集合。

Ex: N = {1,2}.

A set of pure strategies S_i per player i ∈ N combined to form the strategy space S = S₁ ×S₂ ×···×S_n. An element s ∈S is called a strategy proﬁle.
纯策略：一个确定性的行动计划。
S_i ：玩家i的纯策略集，其中包含了玩家i的所有纯策略。
所有玩家的纯策略集组合成为博弈的策略空间。

Ex: S_i = {enter, don’t enter} are identical for both players, i.e., S = S₁ ×S₂ = S_i² .

A set of expected utility payoﬀ fns u_i(s ∈ S): u_i: S→R. We write u(s) = u₁(s),…,u_n(s).
效用函数集，在确定策略下玩家可获得的收益。

Ex: discrete values u_i(e,e) = 1.5, u_i(de,de) = 0, i∈{1,2}, and u₁(e,de) = 3 = u₂(de,e), u₁(de,e) = 0 = u₂(e,de).

通过以上 {N,S,u} 可以唯一确定某一特定的静态博弈，我们把它称作gsf。

信息矩阵

便于直观展示博弈的内容，矩阵位于2维空间，适用于2名玩家的博弈。
3名玩家的博弈用cube或者多个矩阵表示。

	d	c
d	0,0	4,-1
c	-1,4	3,3

其中，列表头代表玩家1的纯策略，行表头代表玩家2的纯策略。
矩阵中每一格对应着相应的玩家1和玩家2的策略组合（strategy proﬁle），我们将之称作结果（outcome）。
每个结果形如 (u₁,u₂) ，分别代表着玩家1和玩家2的期望效益。

对称博弈（Symmetry）

博弈的结果只取决于策略组合中的策略，而与该策略是哪位玩家选择的无关。

在对称博弈中，可以通过对一名玩家的策略研究，得到适用于所有玩家的结果。

混合策略

A mixed strategy of player i is a probability distribution σ_i over i’s pure strategy space S_i. We denote by Σ_i the space of i’s mixed strategies and the full space by Σ = Σ₁ ×…×Σ_n.
混合策略是S_i上的一个概率分布。

Ex: S₁={a,b}，σ₁=(σ₁(a),σ₁(b))，σ₁(a)+σ₁(b)=1

严格劣势策略

A strategy s_i ∈Σ_i is called strictly dominated for player i if there is a σ′ _i ∈ Σ_i such that
u_i(σ′ _i,s_−i) > u_i(s_i,s_−i) for all s_−i ∈ S_−i
(⋆) where S_−i = S₁ ×…×S_i−1 ×S_i+1 ×…×S_n.
如果在其他玩家采取任何策略时，某策略的效用永远低于某另一个确定的策略，则称该低效用的策略为严格劣势策略。

重复剔除劣战略

一名理性的玩家永远不会选择严格劣战略

（I）ESDS：（iterative）elimination of strictly dominated strategies
（严格）剔除劣战略

占优可解（dominance solvable）：如果严格劣势策略的迭代消除(IESDS)过程中幸存下唯一博弈组合s^ES，则称该博弈为占优可解的。

ka1eidoscope

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
博弈论笔记（1）—— 完全信息博弈（施工中）

基本假设玩家只关心自己的回报（效益）。玩家是理性的，如果可以，他们会在所有可选项目中选择能最大化他们效益的。玩家不受智力和其他选择上的限制。即，在该假设下，玩家追求效用最大化。一般形式（Strategic form）A set of players N = {1,…,n}.代表玩家的集合。Ex: N = {1,2}.A set of pure strategie...
复制链接

扫一扫