【博弈论】【第二讲】纳什均衡战略（无限数量战略）

兜兜里有好多糖

已于 2023-11-21 20:33:04 修改

阅读量1.5k

点赞数 2

分类专栏：博弈论文章标签：人工智能机器学习算法数据分析智能合约

于 2023-03-20 11:10:26 首次发布

本文链接：https://blog.csdn.net/Gorege__Hu/article/details/129651573

版权

博弈论专栏收录该内容

12 篇文章 22 订阅

订阅专栏

无限战略博弈的纳什均衡（战略在一个区间内任意选择）

【例题】【产量决策】
【例题】公共地的悲剧
【例题】【产品差异】

【例题】【产量决策】

两家厂商生产同质的产品(homogenous) 。
厂商1的产量为 $q_1$ ，厂商2的产量为 $q_2$ ,
市场出清价格(market clearing price): $P = a-(q_1+q_2)$
两厂商的生产都无固定成本，且每增加一单位产量的边际生产成本相等 $C_1=C_2= c$ 。
两个厂商同时决定各自的产量。

【解】

首先确定博弈三要素：

参与人集合：就是两个卖水的企业
参与人可供选择的战略集合：就是产量的取值范围属于：[0,最大生产能力].
支付函数：首先明确参与人参与博弈的目的是什么（有的时候可能不止一个），本体中他们的目的都是只有一个，那就是利润的最大化。写支付函数就是把他们的目的用数学表达式表达出来。
厂商1和厂商2的支付函数分别为：
利润=销售收益-成本
$\begin{aligned} \pi_1 & =q_1 P-C_1 q_1=q_1\left[a-\left(q_1+q_2\right)\right]-c q_1 \\ & =(a-c) q_1-q_1 q_2-q_1^2 \end{aligned}$
$\begin{aligned} \pi_2 & =q_2 P-C_2 q_2=q_2\left[a-\left(q_1+q_2\right)\right]-c q_2 \\ & =(a-c) q_2-q_1 q_2-q_2^2 \end{aligned}$
写出支付函数之后我们就要求应用什么战略可以使得他的目标最大化，寻找他的纳什均衡，目的也就是使得支付函数最大化。

纳什均衡的充分必要条件是：

$\left\{\begin{array}{l} \max _{q_1}\left[(a-c) q_1-q_1 q_2^*-q_1^2\right] \\ \max _{q_2}\left[(a-c) q_2-q_1^* q_2-q_2^2\right] \end{array}\right.$
使得这两个函数取极大值（当参与人2取产量为 $q_2^*$ 时，参与人1如何应对能够使得自己的支付函数最大？或者当参与人1产量取 $q_1^*$ 时，参与人2如何采取最佳应对使得自己的支付函数能够取得最大值）。
此时，最优化的一阶条件为：
$\begin{aligned} \frac{\partial \pi_1}{\partial q_1} & =\frac{\partial\left[(a-c) q_1-q_1 q_2-q_1^2\right]}{\partial q_1}=0 \\ & \Rightarrow(a-c)-q_2-2 q_1=0 \\ & \Rightarrow q_1=\frac{1}{2}\left(a-c-q_2\right) \end{aligned}$
我们把 $q_1=\frac{1}{2}\left(a-c-q_2\right)$ 称为反应函数。意为参与人1根据这个式子来对参与人2的 $q_2$ 变化进行反应。
同理可得：
$\begin{aligned} \frac{\partial \pi_2}{\partial q_2} & =\frac{\partial\left[(a-c) q_2-q_1 q_2-q_2^2\right]}{\partial q_2}=0 \\ & \Rightarrow(a-c)-q_1-2 q_2=0 \\ & \Rightarrow q_2=\frac{1}{2}\left(a-c-q_1\right) \end{aligned}$

联立反应函数可求得纳什均衡为：

$\left\{\begin{array}{l} q_1=\frac{1}{2}\left(a-c-q_2\right) \\ q_2=\frac{1}{2}\left(a-c-q_1\right) \end{array} \Rightarrow q_1^*=q_2^*=\frac{a-c}{3}\right.$
在这里插入图片描述
$\pi_1^*=\pi_2^*=\frac{(a-c)^2}{9}$

下面用图示展现产量的调整过程（纳什均衡不是一下子达到的，而是两个博弈人通过不断地战略调整，最终到达的一个稳定状态）：
下图展示的是一个最终的结果（最优反应曲线）（横轴表示厂商1的产量，纵轴表示厂商2的产量）（红线表示厂商1对厂商2的反应，绿线表示厂商2对厂商1的反应）。
在这里插入图片描述
假如一开始的时候厂商2的产量是 $q_2^0$ 这么多，那么对应于红线可知，其对应的厂商1对其的反应是 $q_1^0$ 。

但如果厂商1的产量是 $q_1^0$ ，对应到厂商2的反应曲线，则厂商2应该的产量是 $R_2(q_1^0)$ 这么多，而不是 $q_2^0$ 这么多，所以是一个互相不为最优反应的状态，他们一定会胡乱的调整各自的战略，直到双方都达到一个最优战略。
在这里插入图片描述
结果分析，若两个厂商联合成完全垄断企业时：
$\max _Q U=Q(a-c-Q) \Rightarrow\left\{\begin{array}{c} Q^*=\frac{1}{2}(a-c) \\ U\left(Q^*\right)=\frac{1}{4}(a-c)^2 \end{array}\right.$
联合利润是 $U(Q^*)=\frac{1}{4}(a-c)^2$ ，所以每家获得的利润是 $\frac{(a-c)^2}{8}$ ，而分开经营的利润是 $\frac{(a-c)^2}{9}$ ,所以明显是合并成为垄断企业会获得更大的利润。
这其实就是涉及到一个“两寡头的囚徒困境分析”
针对这样的寡头困境：
假设每个厂商有两个选择:“合作”、“不合作”。若厂商选择合作，则厂商的产量为垄断产量的一半;若选择不合作，则产量为纳什均衡产量。于是得到如下战略式博弈矩阵:
$\begin{aligned} & u(\text { 合作 })=\left(a-c-\frac{1}{4}(a-c)-\frac{1}{3}(a-c)\right) \times \frac{1}{4}(a-c)=\frac{5(a-c)^2}{48} \\ & u(\text { 不合作 })=\left(a-c-\frac{1}{4}(a-c)-\frac{1}{3}(a-c)\right) \times \frac{1}{3}(a-c)=\frac{5(a-c)^2}{36} \end{aligned}$
在这里插入图片描述

【例题】公共地的悲剧

某村庄有三个农户: $n = 3$ ，成本: $c = 4$
每只羊的产出函数: $V=100-Q=100- (q_1+q_2+q_3)$ 三农户的得益函数分别为:
$u_1=q_1[100-(q_1+q_2+q_3)]-4q_1$
$u_2=q_2[100-(q_1+q_2+q_3)]-4q_2$
$u_3=q_3[100-(q_1+q_2+q_3)-4q_3$

【解】
在这里插入图片描述
同样的结果：联盟有更好的收益，但是难以实现。

【例题】【产品差异】

产品的物质性能相同但在空间位置上有差异。
消费者均匀分布在长度为1的线性城市，分布密度为1。
位于城市两端的两商店出售物质性能完全相同的产品。
每个商店提供单位产品的成本为 $C$ 。
消费者购买商品的运输成本与离商店的距离成正比，单位距离的运输成本为 $t$ 。
消费者具有单位需求，即要么消费1个单位，要么不消费。
两商店同时选择自己的销售价格。

【解】
豪泰林价格竞争模型：
在这里插入图片描述

我们将消费者的位置差异解释为产品差异，这个差异进一步可以解释为消费者购买产品的旅行成本。旅行成本越高，产品的差异越大，均衡价格从而均衡利润也就越高，原因在于，随着旅行成本的上升，不同商店出售的产品之间的替代性下降，每个商店对附近的消费者的垄断能力加强，商店之间的竞争越来越弱,消费者对价格的敏感度下降,从而每个商店的最优价格接近于垄断价格。另一方面，当旅行成本为零时，不同商店的产品之间具有完全的替代性，没有任何一个商店可以把价格定的高于成本，我们得到伯特兰德均衡结果。
在这里插入图片描述
我们假设商店1和商店2的对产品的定价分别为 $p_1$ 和 $p_2$ 。
我们让住在x的消费者在两个商店之间的总消费是无差异的：价格+旅行成本之和相等。
即： $p_1+tx=p_2+t(1-x)$
从而算出这个相等的点的位置： $x=\frac{p_2-p_1+t}{2t},1-x=\frac{p_1-p_2+t}{2t}$ 。所以我们可知，位于x位置的客户会随机的选择去商店1或者商店2购买该物品（因为去两个商店的总消费是一样的，并且两个商店售卖的商品是完全一样的）。
而位置在(0,x)这个区间内的顾客就会选择去商店1，因为去商店1的总消费要更低。而在(x,1)这个区间内的顾客会选择去商店2消费。
所以我们就确定了去每个商店的顾客人数（因为顾客是按照距离均匀分布的，所以确定某段距离也就确定了顾客的人数）。
所以去商店1的人数是： $R_1=\frac{p_2-p_1+t}{2t}\times1=\frac{p_2-p_1+t}{2t}$ ,去商店2的人数是： $R_2=\frac{p_1-p_2+t}{2t}\times1=\frac{p_1-p_2+t}{2t}$ 。而题目又告知消费者具有单位需求，所以人数就是最终的需求：

商店1和商店2的需求函数分别为：
$\begin{aligned} & D_1\left(p_1, p_2\right)=\frac{p_2-p_1+t}{2 t} \\ & D_2\left(p_1, p_2\right)=\frac{p_1-p_2+t}{2 t} \end{aligned}$
商店1和商店2的得益函数分别为（价格减去成本，然后再乘需求）：
$\begin{aligned} & u_1\left(p_1, p_2\right)=\left(p_1-c\right) D_1=\frac{p_2-p_1+t}{2 t}\left(p_1-c\right) \\ & u_2\left(p_1, p_2\right)=\left(p_2-c\right) D_2=\frac{p_1-p_2+t}{2 t}\left(p_2-c\right) \\ \end{aligned}$
联立反应函数可得：
$p_1^*=p_2^*=c+t \quad u_1^*=u_2^*=t / 2$
那么我们看一下这个结果表示的是什么：
求得的价格等于产品本身的成本加上消费者购买产品的距离成本。消费者购买产品的距离成本越高，则价格定得越高。
同样的，算出来的利润仅由消费者购买产品的距离成本决定，消费者距离成本越高，我商品的利润越高。
但是实际情况并不是这样的，不符合实际情形，那么问题出在哪里呢？
因为我们有一个前提假设就是所有消费者到店里都消费。但是实际情况是在x位置附近的一些消费者，到两家店的总消费是一样的，他可能到店之后就不会着急购物。所以在x区域附近会有一个真空区域，这个区域的顾客对两家商店均没有什么消费需求。所以就会形成左边，中间，右边三段区域。最左边和最右边区域就形成了两个商店的垄断区域，既然形成了垄断区域，那么商店想要怎么定价就会怎么定价。