博弈论第一章完全信息静态博弈

最新推荐文章于 2024-09-15 09:00:00 发布

随便起个名字问题不大

最新推荐文章于 2024-09-15 09:00:00 发布

阅读量1.4k

点赞数 3

分类专栏：博弈论文章标签：博弈论算法

本文链接：https://blog.csdn.net/weixin_45086320/article/details/107537061

版权

博弈论专栏收录该内容

2 篇文章 0 订阅

订阅专栏

完全信息静态博弈

文章目录

完全信息静态博弈

博弈的标准式与纳什均衡

博弈的标准式

博弈的标准式表述包括（1）博弈的参与者（2）每一个参与者可供选择的战略集（3）针对所有参与者可能选择的战略组合，每一个参与者获得的收益

定义1：在一个n个人博弈的标准式表述中，参与者的战略空间为S1,…,Sn，收益函数为u1,…,un，我们用G={S1,…,Sn；u1,…,un}表示此博弈。

重复提出严格劣战略

以囚徒困境问题为例，假设有囚徒n个，对第i个囚徒来说，不论囚徒j选择什么策略，囚徒i选择沉默的收益都低于选择招认的收益，即对于第i个囚徒，沉默相比招认是劣战略。

严格劣战略的定义如下：
在这里插入图片描述
简单来说，如果不论其他参与者选用哪一种战略，对于参与者i，Si战略的收益恒高于Sj，那么就称Sj相对于Si是严格劣战略。

理性的参与者不会选择严格劣战略，因此我们可以把理性参与者不会选择的战略进行剔除，最后得到的一个或几个策略是比较优的。这个过程可称为“重复剔除严格劣战略”。但是这需要假定“参与者是理性的”这句话是共同知识(这包括所有参与者是理性的，所有参与者知道彼此是理性的以及接下来的无穷套娃)，这是重复提出严格劣战略的缺陷之一。

另一个缺陷是这个方法对博弈结果的预测经常是不精确的，如果所有战略都经得住严格劣战略的重复提出，该方法对分析博弈将出现什么结果毫无帮助。(可以理解为在战略集中不存在严格的偏序关系)

纳什均衡的导出和定义

导出纳什均衡的途径之一是证明如果博弈论可以为博弈问题提供一个为一街，此节一定是纳什均衡，原因如下：假设博弈论预测的结果中，给每个参与者选定各自的战略，为使该预测是正确的，必须使参与者自愿选择理论给他推导出的战略。这样，每个参与者要选择的战略必须使针对参与者选择战略的最优反应。定义如下：
在这里插入图片描述
纳什均衡作为比重复提出严格劣战略更强的解的概念，理由如下：如果战略组合{Si}是一个i额纳什均衡，它一定不会被重复剔除严格劣战略所提出，但也可能有重复剔除严格劣战略无法剔除的战略组合，但与纳什均衡一点关系都没有。

证明：如果在一组标准式博弈中重复剔除严格劣战略且最后只剩下一组战略，那么这组战略金牛是该博弈唯一的纳什均衡
证明：一组标准是博弈中如果一个战略是纳什均衡，那么它不会被重复剔除严格劣战略所剔除。
以上证明见书12~13页，这里略过

应用举例

本节我们将通过模型说明：(1)如何把对一个问题的非正式描述转化为一个博弈的标准式表述(2)如何通过哦计算解出博弈的纳什均衡(3)重复提出严格劣战略

古诺双头垄断模型

令q1，q2分别表述企业1、2生产的同质产品的产量，市场中该产品的总供给Q=q1+q2，令P(Q) = a-Q表示市场出清时的价格(即Q<a时，P(Q)=a-Q；Q>a时，P(Q)=0)；设企业i生产qi的总成本C(qi)=c*qi，即企业不存在固定成本，且生产每单位产品的边际成本为常数c，且满足c<a。两个企业进行产量的决策。

根据博弈的标准式，需要包括以下要素：博弈的参与人、每一参与人可以选择的战略，针对每一个可能出现的参与人的战略组合，每一参与人的收益。显然双头垄断模型中当然只有两个参与人，每个企业选择的战略是其产品产量，这里假定产品是连续可分割的，又产量不为负，每个企业的战略空间为[0，∞)。
考虑到Q≥a时，P(Q)=0，则企业产量不会超过a。接下来我们把企业i 的收益表示为其战略的函数：
$\pi_i(q_i,q_j)=q_i[p(q_i+q_j)-c] = q_i[a-(q_i+q_j)-c]$
则根据纳什均衡的定义，我们需要选择参与者的最优反应，即最大化收益：
$max_{s_i\in S_i} u_i(s_i,s_j^*) \\ max \space \pi_i(q_i,q_j^*) = max\space q_i[a-(q_i+q_j^*)-c]$
令一阶导为0，可得解为
$q_i \frac{1}{2} (a-q_j^*-c)$
则有
$q_1 =\frac{1}{2} (a-q_2^*-c) \\ q_2 =\frac{1}{2} (a-q_1^*-c)$
解上述方程可得
$q_1^* = q_2^* = \frac{a-c}3$
还有两种求解最优反应的方法：一个是图形法，一个是运用重复剔除严格劣战略(但是仅限于二维情况能得到最优解)。这里不再详细说明。

贝特兰德的双头垄断模型

贝特兰德提出了另一种模型：企业在竞争时选择的是产品价格，而不像古诺模型中选择产量。我们考虑两种有差异的产品，如果企业1和企业2分别选择价格p1和p2，消费者对企业i的产品的需求为
$q_i(p_i,p_j) = a - p_i +b p_j$
这里0<b<2，即企业i的产品为企业j的产品的替代品的情况，我们假定企业生产没有固定成本，产品的边际成本为c<a，两个企业同时行动。
同样的，我们先表示出企业i的利润：
$\pi_i (p_i,p_j) = q_i(p_i,p_j)[p_i - c] = [a-p_i+bp_j][p_i - c]$
我们最大化问题解可得
$p_i^* = \frac{1}{2} (a+bp_j^*+c)$
即
$p_1^*= \frac{1}{2}(a+bp_2^*+c) \\ p_2^* = \frac{1}{2}(a+bp_1^*+c)$
最后解的
$p_1^* = p_2^* = \frac{a+c}{2-b}$

最后要价仲裁

假定参与争议的双方一方为企业，一方为工会，争议由工资而起；首先双方同时开出自己希望的工资水平w1，w2；而后仲裁人在二者之中选择其中1个作为结果，假定仲裁人本升对工资水平由自认为比较合理的方案x，x服从一定的概率分布，累计分布函数为F(x)，概率密度函数为f(x)，仲裁人最终选择随机变量的一个取值，并选择两个工资中比较接近该取值的一个作为仲裁结果。
显然，企业的目标是使期望工资最小化的仲裁结果，工会则设法使其最大化。若双方的要价(w1,w2)是这一企业和工会间博弈的那是均衡，则w1满足：
$min_{w_1} \space w_1 \cdot F(\frac{w_1+w_2}{2}) + w_2 \cdot [1-F(\frac{w_1+w_2}{2}]$
$max_{w_2} \space w_1 \cdot F(\frac{w_1+w_2}{2}) + w_2 \cdot [1-F(\frac{w_1+w_2}{2}]$
求导可得：
$(w_1-w_2) \cdot \frac{1}{2} f(\frac{w_1+w_2}{2}) = F(\frac{w_1+w_2}{2}) \\ (w_1-w_2) \cdot \frac{1}{2} f(\frac{w_1+w_2}{2}) = 1-F(\frac{w_1+w_2}{2})$
可得
$F(\frac{w_1+w_2}{2}) = \frac{1}{2}$
同时代入一阶条件可得到
$w_1-w_2 = \frac{1}{f(\frac{w_1+w_2}{2})}$

公共财问题

考虑一个有n个村民的村庄，每年夏天，所有村民都要在公共的草地上放牧，村民i的放羊的头数为gi，每只羊的养殖成本为c，当草地上共有G头羊时，每只羊的价值为v(G)，当G>G_max时，青草数量不足，羊没有办法生存，价值为0.春天是，村民同时选择计划放养养的数量，假设羊是连续可分割的。村民i的战略就是选择放羊的数量gi，其战略空间为[0,∞)。
当村民i放羊gi只羊时，其获得的收益为：
$g_i \cdot v(g_1+\cdots +g_{i-1} + g_i +g_{i+1} + \cdots +g_n) - cg_i$
最优化上面的式子，得到的结果为
$v(g_i+g_{-i})+g_iv'(g_i+g_{-i})-c=0$
将gi代入上式，并对i求和再除以n，得到
$v(G)+\frac{1}{n} Gv'(G) - c = 0$
接下来考虑社会最优选择，应满足
$G\cdot v(G) - G\cdot c$
一阶条件为
$v (G) + G v^{'} (G) - c = 0$ 比较社会最优选择和纳什均衡可以发现，纳什均衡时放羊的总数远大于社会最优，纳什均衡的情况下社会资源被过度的使用了。