库诺特模型：完全信息博弈和不完全信息博弈的求解及代码实现

最新推荐文章于 2025-04-18 00:04:02 发布

原创最新推荐文章于 2025-04-18 00:04:02 发布 · 2.1k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#matlab #算法

学习笔记同时被 2 个专栏收录

35 篇文章

订阅专栏

备忘

35 篇文章

订阅专栏

本文介绍了库诺特模型，包括两个企业的产量选择、利润函数和纳什均衡的求解过程。在完全信息博弈中，给出了一个简单的例子，展示了垄断企业和寡头竞争企业的最优产量和利润。接着，讨论了不完全信息博弈，企业2可能有高成本或低成本，通过贝叶斯纳什均衡解决这一问题，并计算了不同情况下的产量和利润。最后，比较了完全信息与不完全信息条件下的产量和利润差异。

写在前面

库诺特（Cournot）模型中，有两个参与者，称为企业1 和企业2；每个企业的战略是选择产量；支付是利润，为两个企业产量的函数。

模型中， $qi∈[0,∞)q_i \in [0,\infty)$ 代表第 $i$ 个企业的产量， $C_i(q_i)$ 代表成本函数， $P=P(q_1+q_2)$ 代表逆需求函数（ $P$ 是价格； $Q (P)$ 是原需求函数。）那么，第 $i$ 个企业的利润为：

$\pi_i(q_1,q_2) = q_i P(q_1+q_2) - C_i(q_i), \quad i=1,2,$

式中， $q_1^*,q_2^*)$ 为纳什均衡（Nash equilibrium）下各企业产量，为

$(q_1^*,q_2) \le (q_1^*,q_2^*) \le (q_1,q_2^*)$

那么，如何求解纳什均衡呢？对每个企业的利润函数求一阶导数，并零其等于零，求解公式为

$\begin{aligned} \frac{\partial \pi_1}{\partial q_1} = P(q_1+q_2) + q_1 P'(q_1+q_2) - C_1'(q_1) = 0, \\ \frac{\partial \pi_2}{\partial q_2} = P(q_1+q_2) + q_2 P'(q_1+q_2) - C_2'(q_2) = 0, \end{aligned}$

上述两个最优化一阶条件定义了两个反应函数（reaction function），为

$\begin{aligned} q_1^* = R_1(q_2), \\ q_2^* = R_2(q_1). \end{aligned}$

下面就两类博弈信息获取情况进行分别讨论，一类是完全信息博弈，一类是不完全信息博弈。

完全信息博弈

求解

更加具体地，考虑一类上述库诺特模型的简单情况。假定每个企业具有相同的不变单位成本，即： $C_1(q_1)=q_1 c$ 和 $C_2(q_2)=q_2 c$ 。需求函数为 $P=a-(q_1+q_2)$ 。那么，两个企业的利润函数可以写为

$\pi_1(q_1,q_2) = q_1 (a-q_1-q_2) - q_1 c,$

$\pi_2(q_1,q_2) = q_2 (a-q_1-q_2) - q_2 c.$

可以得到最优化一阶条件，为

$\frac{\partial \pi_1}{\partial q_1} = (a-q_1-q_2)-q_1-c = 0,$

$\frac{\partial \pi_2}{\partial q_2} = (a-q_1-q_2)-q_2-c = 0.$

下面是求解过程，求得反应函数 $R_1(q_2)$ 和 $R_2(q_1)$ 。对于上式，把 $q_1$ 保留，把其他变量挪向等号右边，为

$q_1^* = a-q_2-c \\ \Rightarrow q_1^* = 0.5(a-q_2-c).$

同样地，对于上式，把 $q_2$ 保留，把其他变量挪向等号右边，为

$q_2^* = a-q_1-c \\ \Rightarrow q_2^* = 0.5(a-q_1-c).$

将上两式联立，求解得到 $q_1^*$ 和 $q_2^*$ ，这里可以手算得到，但是我们可以借助工具来求解等式。下面给出 MATLAB 代码，为

clc;clear;

syms q1 q2 a c

eq1 = 0.5*(a-q2-c)-q1 == 0;
eq2 = 0.5*(a-q1-c)-q2 == 0;

[sol_q1 sol_q2] = solve(eq1,eq2,q1,q2);

disp(['The value of q1 is: ', char(sol_q1)]);
disp(['The value of q2 is: ', char(sol_q2)]);

最后得到纳什均衡，为

$q_1^* = q_2^* = \frac{1}{3} (a-c).$

将纳什均衡的值代入利润函数中，为

$\begin{aligned} \pi_1(q_1^*,q_2^*) &= \frac{1}{3}(a-c)(a-\frac{2}{3}a+\frac{2}{3}) - \frac{1}{3}(a-c)c \\ &= \frac{1}{3} (a-c)(\frac{1}{3} a + \frac{2}{3} c) - \frac{1}{3} ac + \frac{1}{3} c^2 \\ &= \frac{1}{9} a^2 + \frac{2}{9} ac - \frac{1}{9} ac - \frac{2}{9} c^2 - \frac{1}{3} ac + \frac{1}{3} c^2 \\ &= \frac{1}{9} a^2 - \frac{2}{9} ac + \frac{1}{9} c^2 \\ &= \frac{1}{9} (a-c)^2. \end{aligned}$

与垄断情况作比较，给出垄断企业问题命名，为

$\max_Q \pi = Q(a-Q-c).$

求解一阶最优性条件，为

$\frac{\partial \pi}{\partial Q} = a - 2Q -c = 0,$

求解得到

$Q^*_{\text{monopoly}} = \frac{1}{2}(a-c).$

那么垄断利润为

$\begin{aligned} \pi^*_{\text{monopoly}} &= \frac{1}{2}(a-c)(a-\frac{1}{2}a+\frac{1}{2}c-c) \\ &= \frac{1}{2}(a-c) \cdot \frac{1}{2}(a-c) \\ &= \frac{1}{4}(a-c)^2 \end{aligned}$

结论

就产量而言，

垄断企业的最优产量为 $Qmonopoly∗=12(a−c)Q^*_{\text{monopoly}} = \frac{1}{2} (a-c)$ ；
寡头竞争中企业的最优产量为 $QCournot∗=23(a−c)Q^*_{\text{Cournot}} = \frac{2}{3} (a-c)$ 。

即： $Qmonopoly∗<QCournot∗Q^*_{\text{monopoly}} < Q^*_{\text{Cournot}}$ 。

就利润而言，

垄断企业的利润为 $πmonopoly∗=14(a−c)2\pi^*_{\text{monopoly}} = \frac{1}{4}(a-c)^2$ ；
寡头竞争中企业的利润为 $πCournot∗=29(a−c)2\pi^*_{\text{Cournot}} = \frac{2}{9}(a-c)^2$

即： $πmonopoly∗<πCournot∗\pi^*_{\text{monopoly}} < \pi^*_{\text{Cournot}}$ 。

可以发现，垄断企业的产量低于寡头竞争的总产量，而利润高于寡头竞争中的总利润。

不完全信息博弈

介绍

上一节讨论的模型，其基础建立在博弈中所有参与人都已获知其他人的成本，即成本是所有参与人的共同知识。但是，现实中许多情况不满足这样的假设，即有些情况下无法获知对方的所有信息。例如，和一位陌生人打交道时，不知道对方阵营九宫格，对方到底是守序善良呢，还是混乱邪恶呢，我们不知道。

考虑一类和人交往的例子。

对方是守序善良的人，那么我们自己自然可以在与对方的交往中获得许多快乐；反之，对方是混乱邪恶的人，那么我们在与之交往的过程中不免难过。这里的快乐和难过可以抽象为支付函数。

在传统的博弈论视角里，我们似乎无法处理这样的情况。因为一个人无法既守序善良又混乱邪恶。我们只能够猜测他是守序善良的可能性，或者混乱邪恶的可能性。那么，海萨尼（Harsanyi）提出一种方法，引入“自然”（nature）来帮我们选择。我们可以考虑，当自然选择对方是守序善良时，我们应该怎么做；又或者，当自然选择对方是混乱邪恶时，我们应该怎么做。

这样就解决了一个人无法既守序善良又混乱邪恶的难题。

上述过程称为海萨尼转换（Harsanyi transformation）。

通过海萨尼转换，最终得到的纳什均衡称为贝叶斯纳什均衡（Baysian Nash equilibrium）。

求解

继续考虑上一节的库诺特模型，但将条件改为不完全信息条件，即博弈过程中，有企业1 和企业2，企业2 有高成本和低成本两类。

那么，两个企业的利润函数为

$\pi_1(q_1,q_2) = q_1 (a-q_1-q_2) - q_1 c_1,$

$\pi_2^L(q_1,q_2^L) = q_2 (a-q_1-q_2^L) - q_2 c_2^L.$

$\pi_2^H(q_1,q_2) = q_2 (a-q_1-q_2^H) - q_2 c_2^H.$

式中，上标 $L$ 代表低成本企业2， $H$ 代表高成本企业2。

假定企业1 的成本 $c_1$ 为共同知识，企业2 的成本可能是 $c_2^L$ ，也可能是 $c_2^H$ ， $c_2^L < c_2^H$ 。企业2 知道自己的成本是 $c_2^L$ 还是 $c_2^H$ ，但企业1 只知道 $c_2=c_2^L$ 的可能性为 $μ\mu$ ， $c_2=c_2^H$ 的可能性为 $(1−μ)(1-\mu)$ ， $μ\mu$ 为共同知识。

考虑一类简单情况，给定参数如下。

$a=2,c_1=1,c_2^L=\frac{3}{4},c_2^H=\frac{5}{4},\mu=\frac{1}{2}.$

那么，企业1 的利润函数为

$\pi_1 = q_1(1-q_1-q_2),$

企业2 的利润函数为

$\pi_2^L = q_2(\frac{5}{4}-q_1-q_2),$

或

$\pi_2^H = q_2(\frac{3}{4}-q_1-q_2),$

求企业2 的反应函数，为

$\frac{\partial \pi_2^L}{\partial q_2} = (\frac{5}{4}-q_1-q_2)-q_2=0,$

或

$\frac{\partial \pi_2^H}{\partial q_2} = (\frac{3}{4}-q_1-q_2)-q_2=0.$

对于上两式，把 $q_2$ 保留，把其他变量挪向等号右边，为

$q_2^{L*} = \frac{1}{2}(\frac{5}{4}-q_1),$

或

$q_2^{H*} = \frac{1}{2}(\frac{3}{4}-q_1),$

那么，企业1 选择产量 $q_1$ ，需要最大化下列利润期望函数，为

$\pi_1 = \frac{1}{2} q_1 (1-q_1-q_2^{L*}) + \frac{1}{2} q_1 (1-q_1-q_2^{H*}).$

一阶最优化条件为

$\begin{aligned} \frac{\partial E \pi_1}{\partial q_1} &= \frac{1}{2} (1-q_1-q_2^{L*}) - \frac{1}{2} q_1 + \frac{1}{2} (1-q_1-q_2^{H*}) - \frac{1}{2} q_1 \\ &= \frac{1}{2} -\frac{1}{2} q_1 - \frac{1}{2} q_2^{L*} - \frac{1}{2} q_1 + \frac{1}{2} - \frac{1}{2} q_1 - \frac{1}{2} q_2^{H*} - \frac{1}{2} q_1 \\ &= 1 - 2 q_1 - \frac{1}{2} (q_2^{L*}+q_2^{H*}) = 0. \end{aligned}$

企业1 的最优产量为

$q_1^* = \frac{1}{2}(1-\frac{1}{2}q_2^{L*}-\frac{1}{2}q_2^{H*}).$

联立 $q_1^*$ 、 $q_2^{L*}$ 和 $q_2^{H*}$ 的表达式，可以得到贝叶斯均衡为

$q_1^*=\frac{1}{3},q_2^{L*} = \frac{11}{24},q_2^{H*}=\frac{5}{24}.$

上面考虑的情况是企业1 不知道企业2 成本的情况。

再考虑一类企业2 为低成本的情况。

企业1 的反应函数为

$q_{1NE}^* = \frac{1}{2}(1-q_2^{L*}),$

企业2 的反应函数为

$q_{2NE}^{L*} = \frac{1}{2}(\frac{5}{4}-q_1),$

那么，纳什均衡为

$q_{1NE}^*=\frac{1}{4},q_{2NE}^{L*} = \frac{1}{2}.$

最后考虑一类企业2 为高成本的情况。

企业1 的反应函数为

$q_{1NE}^* = \frac{1}{2}(1-q_2^{L*}),$

企业2 的反应函数为

$q_{2NE}^{H*} = \frac{1}{2}(\frac{3}{4}-q_1),$

那么，纳什均衡为

$q_{1NE}^*=\frac{5}{12},q_{2NE}^{H*} = \frac{1}{6}.$

上述求解过程可以通过 MATLAB 代码求解得到，代码如下。

clc;clear;close all;

syms q1 q2_L q2_H
syms a c1 c2_L c2_H

cost = 'high-and-low';
% cost = 'low';
% cost = 'high';

if strcmp(cost,'high-and-low')
%% 求解方程组（高、低成本都算进去）
    eq1 = 0.5*(0.75-q1)-q2_H == 0;
    eq2 = 0.5*(1.25-q1)-q2_L == 0;
    eq3 = 0.5*(1-0.5*q2_L-0.5*q2_H)-q1 == 0;

    [sol_q1, sol_q2_L, sol_q2_H] = solve(eq1, eq2, eq3, q1, q2_L, q2_H);
    
    pi1 = 0.5*sol_q1*(1-sol_q1-sol_q2_L) +  0.5*sol_q1*(1-sol_q1-sol_q2_H);
    pi2_L = sol_q2_L*(1.25-sol_q1-sol_q2_L);
    pi2_H = sol_q2_H*(0.75-sol_q1-sol_q2_H);

    disp(['The value of q1 is: ',char(sol_q1)]);
    disp(['The value of q2_L is: ', char(sol_q2_L)]);
    disp(['The value of q2_H is: ', char(sol_q2_H)]);
    
    disp(['The payoff of q1 is: ',char(pi1)]);
    disp(['The payoff of q2_L is: ', char(pi2_L)]);
    disp(['The payoff of q2_H is: ', char(pi2_H)]);
elseif strcmp(cost,'low')
%% 求解方程组（仅算低成本）
    eq1 = 0.5*(1.25-q1)-q2_L == 0;
    eq2 = 0.5*(1-q2_L)-q1 == 0;

    [sol_q1, sol_q2_L] = solve(eq1, eq2, q1, q2_L);
    
    pi1 = sol_q1*(1-sol_q1-sol_q2_L);
    pi2_L = sol_q2_L*(1.25-sol_q1-sol_q2_L);

    disp(['The value of q1 is: ',char(sol_q1)]);
    disp(['The value of q2_L is: ', char(sol_q2_L)]);
    
    disp(['The payoff of q1 is: ',char(pi1)]);
    disp(['The payoff of q2_L is: ', char(pi2_L)]);
elseif strcmp(cost,'high')
%% 求解方程组（仅算高成本）
    eq1 = 0.5*(0.75-q1)-q2_H == 0;
    eq2 = 0.5*(1-q2_H)-q1 == 0;

    [sol_q1, sol_q2_H] = solve(eq1, eq2, q1, q2_H);
    
    pi1 = sol_q1*(1-sol_q1-sol_q2_H);
    pi2_H = sol_q2_H*(0.75-sol_q1-sol_q2_H);

    disp(['The value of q1 is: ',char(sol_q1)]);
    disp(['The value of q2_H is: ', char(sol_q2_H)]);
    
    disp(['The payoff of q1 is: ',char(pi1)]);
    disp(['The payoff of q2_H is: ', char(pi2_H)]);
else
    error('The selected COST is wrong!')
end

结论

对于本节讨论的三类情况，企业1 不知道企业2 的成本，企业1 知道企业2 为低成本和企业1 知道企业2 为高成本，得到的贝叶斯均衡/纳什均衡总结如下。

$\begin{aligned} &q_{1NE}^{L*} = \frac{1}{4} < q_1^* = \frac{1}{3}, \quad q_{1NE}^{H*} = \frac{5}{12} > q_1^* = \frac{1}{3}, \\ &q_{2NE}^{L*} = \frac{1}{2} > q_2^{L*} = \frac{11}{24}, \quad q_{2NE}^{H*} = \frac{1}{6} < q_2^{H*} = \frac{5}{24}. \end{aligned}$

各企业利润总结如下。

$\begin{aligned} &\pi_1^* = \frac{1}{9}, \quad \pi_2^{L*} = \frac{121}{576}, \quad \pi_2^{H*} = \frac{25}{576}, \\ &\pi_{1NE}^{L*} = \frac{1}{16}, \quad \pi_{2NE}^{L*} = \frac{1}{4}, \\ &\pi_{1NE}^{H*} = \frac{25}{144}, \quad \pi_{2NE}^{H*} = \frac{1}{36}. \end{aligned}$

写得更加易读一些，为

$\begin{aligned} &\pi_1^* = 0.1111..., \quad \pi_2^{L*} = 0.2101, \quad \pi_2^{H*} = 0.0434, \\ &\pi_{1NE}^{L*} = 0.0625, \quad \pi_{2NE}^{L*} = 0.25, \\ &\pi_{1NE}^{H*} = 0.1736, \quad \pi_{2NE}^{H*} = 0.0278. \end{aligned}$