博弈论——1完全信息静态博弈

最新推荐文章于 2024-07-09 15:14:17 发布

送快递的勃仕

最新推荐文章于 2024-07-09 15:14:17 发布

阅读量376

点赞数

文章标签：数学建模

本文链接：https://blog.csdn.net/tew_315/article/details/130896480

版权

Game Theory

Chapter1 Static Games of Complete Information

static game

players simultaneously choose actions
receive payoffs – depend on the combination of actions

complete information

payoff function is common knowledge among all players

eg: Prisoners’ Dilemma

Prisoner2
Mum Fink
Prisioner1 Mum -1,-1 -9,0
Fink 0,-9 -6,-6

Prisoner 1: row player

Prisoner 2: column layer

		Prisoner2
		Mum	Fink
Prisioner1	Mum	-1,-1	-9,0
	Fink	0,-9	-6,-6

tuple-normal form

一个策略式博弈由一个三元组tuple，即有序向量 $\Gamma$ 表示而成

包含三部分：

players $N=\{1,2,3,...\}$
strategies $S_i$ , $S=S_1\times{S_2}\times{...}S_n$ 表示所有策略的集合（笛卡尔乘积）
payoff $u_i(s)$ ，是策略空间到实数 $R$ 的映射

$\Gamma=(N,(S_i)_{i\in{N}},(u_i)_{i\in{N}})$

iterated elimination

strictly dominated by:

每一维度都改进

$u_i(s_i,s_{-i})<u_i(s^{'}_i,s_{-i}),\forall{s_-i}\in{S_{-i}}$

rational player do not play strictly dominated strategies理性人不会选择被严格占优的策略

dominant strategy

弱占优

$u_i(s_i^*,s_{-i})\geq{u_i(t_i,s_{-i})},\forall{i,t_i\neq{s_i^*},t_i\in{S_i}}$

反复剔除严格劣策略：

eg: iterated elimination of strictly dominated strategies

Player2
Left Middle
Player1 Up 1,0 1,2
Down 0,3 0,1

Up>Down

Player2
Left Middle
Player1 Up 1,0 1,2

		Player2
		Left	Middle
Player1	Up	1,0	1,2
	Down	0,3	0,1

		Player2
		Left	Middle
Player1	Up	1,0	1,2

剔除劣策略对剔除顺序敏感，可能会产生不同的结果

令 $N={1,2,...,n}$ 为一个有限集合，对每一个 $i\in{N}$ ，令 $X_i$ 为任意集合，令 $X:=\times_{i\in{N}}X_i$ ，对每一个 $i\in{N}$ ，定义 $X_{-i}:=\times_{j\neq{i}}X_i$ ，即出来集合 $X_i$ 之外的所有集合 $X_j$ 的笛卡尔乘积

笛卡尔乘积：

$A×B=\{(x,y)|x\in{A}{\cap}y\in{B}\}$

$A=\{a,b\}, B=\{0,1,2\}$ ，则

$A{\times}B=\{(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)\}$

$B{\times}A=\{(0, a), (0, b), (1, a), (1, b), (2, a), (2, b)\}$

best response

$u_i(s_i,s_{-i})=max_{t_i\in{S_i}}u_i(t_i,s_{-i})$

最佳应对就是该策略在其他策略之外所有其他人的策略下的收益为这个策略集中的最大值

Nash equilibrium

for each player is best response to the other players’ strategies
$NE:u_i(s^*){\geq}u_i(s_i,s^*_{-i})$

NE:

L C R
T 0,4 4,0 5,3
M 4,0 0,4 5,3
B 3,5 3,5 6,6

L列0,4,3 选4；

C列4,0,3 选4；

R列5,5,6 选6；

T行4,0,3 选4；

M行0,4,3 选4；

B行 5,5,6 选6.

	L	C	R
T	0,4	4,0	5,3
M	4,0	0,4	5,3
B	3,5	3,5	6,6

纳什均衡下，player 单方面偏离均衡点无利可图

eg:古诺模型

假设古诺模型中有两个参与人，即企业 $1$ 和企业 $2$ ，他们的战略是进行产量选择。用有序向量 $\Gamma=(N,(S_i)_{i\in{N}},(\pi_i)_{i\in{N}})$ 表示古诺博弈。

其中，

参与人 $N=\{1,2\}$
策略向量 $S_i$ , $S=S_1\times{S_2}$ 表示所有策略的集合
我们用 $q\in[0,\infty)$ 代表第 $i$ 个企业的产量， $C_i(q_i)$ 代表成本函数， $P=P(q_1+q_2)$ 代表逆需求函数。第 $i$ 个企业的利润函数为：

$\pi_i(q_1,q_2)=q_iP(q_1+q_2)-C_i(q_i),i={1,2}$

我们定义纳什均衡产量 $q_1^*,q_2^*)$ ：
$q_1^*=argmax\pi_1(q_1,q_2^*)=q_1P(q_1+q_2^*)-C_1(q_1)$

$q_2^*=argmax\pi_2(q_1^*,q_2)=q_2P(q_1^*+q_2)-C_2(q_2)$

为了使得每个企业互相都是对方的最佳应对，我们取利润函数的一阶导数并令其等于零：
$\frac{\partial\pi_1}{\partial{q_1}}=P(q_1+q_2)+q_1P'(q_1+q_2)-C_1'(q_1)=0$

$\frac{\partial\pi_2}{\partial{q_2}}=P(q_1+q_2)+q_2P'(q_1+q_2)-C_2'(q_2)=0$

为定义厂商的利润最大化产出与它认为竞争对手将生产的数量直接的关系，我们定义反应曲线：
$q_1^*=R_1(q_2)$

$q_2^*=R_2(q_1)$

将两个厂商的反应函数联立，其交点即双方的最佳应对，因此没有哪个厂商会有改变行为的冲动，此时各个厂商准确地假定了它的竞争者将生产的产量，并相应最大化了自己的利润。此时的那是均衡也成为古诺均衡。

斯塔克伯格模型

古诺模型中两个寡头厂商是同时做出产量决策的，且古诺模型属于静态博弈模型，因此如果其中任意一个厂商做出非均衡下的产量决策后，古诺模型并不会给出后续调整的动态变化，因此寡头垄断市场产量博弈模型需要构建一种动态的模型。假设两个与古诺模型一致的厂商中，有一方先进行选择，另一方由先决策的一方制定的产量而进行决策，且双方不仅有先后之分。

假设斯塔克伯格模型中有两个参与人，即企业 $1$ 和企业 $2$ ，他们的战略是进行产量选择。用有序向量 $\Gamma=(N,(S_i)_{i\in{N}},(\pi_i)_{i\in{N}})$ 表示古诺博弈。

其中，

参与人 $N=\{1,2\}$

策略向量 $S_i$ , $S=S_1\times{S_2}$ 表示所有策略的集合

我们用 $q\in[0,\infty)$ 代表第 $i$ 个企业的产量， $C_i(q_i)$ 代表成本函数， $P=P(q_1+q_2)$ 代表逆需求函数。第 $i$ 个企业的利润函数为：

$\pi_i(q_1,q_2)=q_iP(q_1+q_2)-C_i(q_i),i={1,2}$

使用逆向归纳法，找到子博弈的完美纳什均衡，首先分析第二个阶段厂商2的决策，此时厂商2已经知道厂商1做出的决定，根据产量 $q_1$ 我们能够通过古诺模型中的反应曲线计算出厂商2的产量：
$q_2^*=R_2(q_1)$
而与此同时，厂商1知道厂商2的决策思路，在选择 $q_1$ 时就已知了 $q_2^*=R_2(q_1)$ ，将此式直接代入其利润函数能够直接得到：
$\pi(q_1,q_2^*)=q_1P(q_1+q_2^*)-C_1(q_1)$
此时二元利润函数实际上已经转化为了关于自身产量 $q_1$ 的医院函数 $\pi(q_1)$ 。

因此当厂商1考虑了厂商2的反应之后，厂商1自身的利润完全可以由自己控制，使得其自身利益最大化，我们有条件：
$\frac{d\pi}{dq_1}=P(q_1+q_2^*)+q_1P'(q_1+q_2^*)-C_1'(q_1)=0$
通过一阶条件我们能够得到厂商1的最佳反应 $q_1^*$ ，因此也能够推导出对应厂商2在第二阶段的最佳反应 $q_2*$ 。这个运用逆向归纳法得到的策略向量也就是这个动态博弈的唯一的子博弈完美纳什均衡。

min max

安全水平：最大最小值

最坏收益：

$min_{t_{-i}\in{S_{-i}}}u_i(s_i,t_{-i})$
最大化最坏收益即安全水平，不低于最坏可能即安全情况
$v_i=max_{s_i\in{S_i}}\ min_{t_{-i}\in{S_{-i}}}\ u_i(s_i,t_{-i})$

$u_i(s_i^*,t_{-i}\geq{v_i}),{\forall}t_{-i}\in{S_{-i}}$

Mixed Strategies and Existence of Equilibrium

送快递的勃仕

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
博弈论——1完全信息静态博弈

古诺模型中两个寡头厂商是同时做出产量决策的，且古诺模型属于静态博弈模型，因此如果其中任意一个厂商做出非均衡下的产量决策后，古诺模型并不会给出后续调整的动态变化，因此寡头垄断市场产量博弈模型需要构建一种动态的模型。将两个厂商的反应函数联立，其交点即双方的最佳应对，因此没有哪个厂商会有改变行为的冲动，此时各个厂商准确地假定了它的竞争者将生产的产量，并相应最大化了自己的利润。使用逆向归纳法，找到子博弈的完美纳什均衡，首先分析第二个阶段厂商2的决策，此时厂商2已经知道厂商1做出的决定，根据产量。
复制链接

扫一扫