文章目录
此部分博弈论笔记参考自经济博弈论(第四版)/谢识予和老师的PPT,是在平时学习中以及期末备考中整理的,主要注重对本章节知识点的梳理以及重点知识的理解,细节和逻辑部分还不是很完善,可能不太适合初学者阅读(看书应该会理解的更明白O(∩_∩)O哈哈~)。现更新到博客上供大家浏览,希望能够帮助到正在学习博弈论的大家。
第六章 不完全信息静态表示
6.1 不完全信息静态博弈和贝叶斯纳什均衡
在一个静态博弈中,至少有一个博弈方不完全清楚其他某些博弈方的策略或得益等信息,但知道其策略或得益等信息空间的概率分布,这种博弈叫不完全信息静态博弈,也叫贝叶斯博弈。
6.1.1 不完全信息静态博弈的例子
-
暗标拍卖
暗标拍卖通常有这样几个基本特征:(1)密封递交标书; (2)统一时间公证开标; (3) 标价最高者以所报标价中标。
- 由于博弈方的标书密封递交和同时开标, 各博弈方在选择策略之前都无法知道其他博弈方策略, 而且是一次性选择, 因此这是静态博弈问题。
- 各博弈方无法知道确知其他博弈方拍得标的物的得益,最多能根据一般情况或以往经验作大致判断。 这意味着, 暗标拍卖博弈是不完全信息博恋, 且是不完全信息静态博弈。
-
古诺模型
-
假设:两寡头同时作产量 决策, 市场需求为 P ( Q ) = a − Q , Q = q 1 + q 2 P(Q)=a-Q, Q=q_1+q_2 P(Q)=a−Q,Q=q1+q2 为市场总产量, q 1 、 q 2 q_1 、 q_2 q1、q2 分别是两个厂商产量。厂商 1 成本函数 C 1 = C 1 ( q 1 ) = c 1 q 1 C_1=C_1\left(q_1\right)=c_1 q_1 C1=C1(q1)=c1q1, 即无固定成本, 边际成本为 c 1 c_1 c1, 这是两个厂商都知道的。厂商 2 的成本有两种可能情 况, 一种 C 2 = C 2 ( q 2 ) = c H q 2 C_2=C_2\left(q_2\right)=c_H q_2 C2=C2(q2)=cHq2, 另一种 C 2 = C 2 ( q 2 ) = c L q 2 C_2=C_2\left(q_2\right)=c_L q_2 C2=C2(q2)=cLq2, 而 c H > c L c_H>c_L cH>cL, 究 竟是哪种成本厂商 2 自己知道,厂商 1 只知道前一种的概率 θ \theta θ, 后一种的概率 1 − θ 1-\theta 1−θ 。
-
分析:
- 当高成本, q 2 ∗ ( c H ) q_{2}{ }^*\left(c_{H}\right) q2∗(cH) 满足: max q 2 [ ( a − q 1 − q 2 ) − c H ] q 2 \max _{q_2}\left[\left(a-q_1-q_2\right)-c_{\mathrm{H}}\right] q_2 maxq2[(a−q1−q2)−cH]q2
- 当低成本, q 2 ∗ ( c L ) \mathbf{q}_{\mathbf{2}}{ }^*\left(\mathbf{c}_{\mathbf{L}}\right) q2∗(cL) 满足: max q 1 [ ( a − q 1 − q 2 ) − c L ] q 2 \max_{q_1} \left[\left(a-q_1-q_2\right)-c_L\right] q_2 maxq1[(a−q1−q2)−cL]q2
- 厂商一的策略: max q 1 { θ [ a − q 1 − q 2 ∗ ( c H ) − c 1 ] q 1 + ( 1 − θ ) [ a − q 1 − q 2 ∗ ( c L ) − c 1 ] q 1 } \max _{q_1}\left\{\theta\left[a-q_1-q_2^{*}\left(c_H\right)-c_1\right] q_1+(1-\theta)\left[a-q_1-q_2^*({c_L})-c_1\right] q_1\right\} maxq1{θ[a−q1−q2∗(cH)−c1]q1+(1−θ)[a−q1−q2∗(cL)−c1]q1}
-
求解:三个式子各自求极值,然后联立求解,得:
q 2 ∗ ( c H ) = a − 2 c H + c 1 3 + 1 − θ 6 ( c H − c L ) q 2 ∗ ( c L ) = a − 2 c L + c 1 3 − θ 6 ( c H − c L ) q 1 ∗ = a − 2 c 1 + θ c H + ( 1 − θ ) c L 3 \begin{aligned} & q_2^*\left(c_H\right)=\frac{a-2 c_H+c_1}{3}+\frac{1-\theta}{6}\left(c_H-c_L\right) \\ & q_2^*\left(c_L\right)=\frac{a-2 c_L+c_1}{3}-\frac{\theta}{6}\left(c_H-c_L\right) \\ & q_1^*=\frac{a-2 c_1+\theta c_H+(1-\theta) c_L}{3} \end{aligned} q2∗(cH)=3a−2cH+c1+61−θ(cH−cL)q2∗(cL)=3a−2cL+c1−6θ(cH−cL)q1∗=3a−2c1+θcH+(1−θ)cL -
讨论:当 c 2 = c H c_2=c_H c2=cH时, q 2 ∗ ( c H ) > q 2 ∗ q_2^*(c_H)>q_2^* q2∗(cH)>q2∗,当 c 2 = c L c_2=c_L c2=cL时, q 2 ∗ ( c L ) < q 2 ∗ q_2^*(c_L)<q_2^* q2∗(cL)<q2∗.
当厂商2实际高成本时,他本应生产较少,但他考虑到对方不知道自己高成本, 所以对方选择的产量会小于知道自已高成本时的最佳产量, 因此自己可以适当多生产一些。
-
6.1.2 不完全信息静态博弈的一般表示
在完全信息静态博弈时,我们将其表示为: G = { S 1 , ⋯ , S n ; u 1 , ⋯ , u n } G=\left\{S_1, \cdots, S_n ; u_1, \cdots, u_n\right\} G={S1,⋯,Sn;u1,⋯,un},
其中 S i S_i Si 是博弈方 i i i 的策略空间, 即全部可选策略的集合, u i u_i ui 是其得益函数 u i = u i ( s 1 , ⋯ , s n ) u_i=u_i\left(s_1, \cdots, s_n\right) ui=ui(s1,⋯,sn) 。
到了不完全信息静态博弈中,需要表示信息的不完全性,用 T T T来表示: t i t_i ti 表示博弈方 i i i 的类型, T T T ,表示博弈方 i i i 的类型空间 t i ∈ T i , u i ( a 1 , ⋯ , a n , t i ) t_i \in T_i, u_i\left(a_1, \cdots, a_n, t_i\right) ti∈Ti,ui(a1,⋯,an,ti) 表示博弈方 i i i 在策略组合 ( a 1 , ⋯ , a n ) \left(a_1, \cdots, a_n\right) (a1,⋯,an) 下的得益。信息不完全可以通过 t i t_i ti 的取值只有博弈方 i i i 知道而其他博弈方不清楚这一情况来反映。
另一个需要添加的是博弈方对不完全信息概率的判断:如果用博弈方 i i i 在自己类型为 t i t_i ti 的前提下, 对其他博弈方类型的所有可能(或类型组合) = ( t 1 , ⋯ =\left(t_1, \cdots\right. =(t1,⋯ t i − 1 , t i + 1 , ⋯ , t n ) \left.t_{i-1}, t_{i+1}, \cdots, t_n\right) ti−1,ti+1,⋯,tn) 的条件概率 p i = p i { t − i ∣ t i } p_i=p_i\left\{t_{-i} \mid t_i\right\} pi=pi{t−i∣ti}, 作为反映不完全信息的概率判断, 则可用 G = { A 1 , ⋯ , A n ; T 1 , ⋯ , T n ; p 1 , ⋯ , p n ; u 1 , ⋯ , u n } G=\left\{A_1, \cdots, A_n ; T_1, \cdots, T_n ; p_1, \cdots, p_n ; u_1, \cdots ,u_n\right\} G={A1,⋯,An;T1,⋯,Tn;p1,⋯,pn;u1,⋯,un}表示不完全信息静态博弈问题。
以不完全信息古诺博弈为例:
厂商
1
的行动空间-
A
1
=
{
q
1
}
厂商
2
的行动空间-
A
2
=
{
q
2
}
厂商
1
的类型空间-
T
1
=
{
c
1
}
厂商
2
的类型空间-
T
2
=
{
c
H
,
c
L
}
厂商
1
的得益- -
u
1
=
π
1
(
q
1
,
q
2
,
t
1
)
厂商
2
的得益–
u
2
=
π
2
(
q
1
,
q
2
,
t
2
)
厂商
1
条件概率-
p
1
{
c
H
∣
c
1
}
=
θ
;
p
1
{
c
L
∣
c
1
}
=
1
−
θ
厂商
2
条件概率-
p
2
{
c
1
∣
c
H
}
=
1
;
p
2
{
c
1
∣
c
L
}
=
1
\begin{aligned} & \text { 厂商 } 1 \text { 的行动空间- } A_1=\left\{q_1\right\} \\ & \text { 厂商 } 2 \text { 的行动空间- } A_2=\left\{q_2\right\} \\ & \text { 厂商 } 1 \text { 的类型空间- } T_1=\left\{c_1\right\} \\ & \text { 厂商 } 2 \text { 的类型空间- } T_2=\left\{c_H, c_L\right\} \\ & \text { 厂商 } 1 \text { 的得益- - } u_1=\pi_1\left(q_1, q_2, t_1\right) \\ & \text { 厂商 } 2 \text { 的得益-- } u_2=\pi_2\left(q_1, q_2, t_2\right)\\ & \text { 厂商 } 1 \text { 条件概率- } p_1\{c_H|c_1\}=\theta;p_1\{c_L|c_1\}=1-\theta\\ &\text { 厂商 } 2 \text { 条件概率- } p_2\{c_1|c_H\}=1; p_2\{c_1|c_L\}=1 \end{aligned}
厂商 1 的行动空间- A1={q1} 厂商 2 的行动空间- A2={q2} 厂商 1 的类型空间- T1={c1} 厂商 2 的类型空间- T2={cH,cL} 厂商 1 的得益- - u1=π1(q1,q2,t1) 厂商 2 的得益– u2=π2(q1,q2,t2) 厂商 1 条件概率- p1{cH∣c1}=θ;p1{cL∣c1}=1−θ 厂商 2 条件概率- p2{c1∣cH}=1;p2{c1∣cL}=1
6.1.3 海萨尼均衡
海萨尼( Harsanyi )1967年提出将“不完全信息静态博弈” 转化为“完全但不完美信息动态博弈”:
- 第一步:引进虚拟博弈方 “自然”, “自然”进行动态博弈第一阶段的行动选择
- “自然” 为每个博弈方随机选择类型 t = ( t 1 , … , t n ) t=\left(t_1, \ldots, t_n\right) t=(t1,…,tn)其中 t i ∈ T i , i = 1 , ⋯ , n t_i \in T_i, i=1, \cdots, n ti∈Ti,i=1,⋯,n
- 第二步:表示不完全信息
- 每个博弈方知道自己的类型,但不知道“自然”为其他博弈方选择的类型,只知道所选类型的概率分布。
- 第三步:博弈方在动态博弈第二阶段进行原来的静态博弈 a 1 , … , a n a_1, \ldots, a_n a1,…,an
- 第四步:表示得益
- 除 “自然” 博弈方外, 其余博弈方各自得益 u i = u i ( a 1 , … , a n u_i=u_i\left(a_1, \ldots, a_n\right. ui=ui(a1,…,an, t i ) \left.t_i\right) ti)
在作了海萨尼转换之后, 仍然有对 “类型” 的判断问题。但这时对类型的判断形式上变成了对博弈进程,即 “自然”对实际博弈方类型选择的判断, 其概率分布与类型的概率分布相同, 即 “自然”以概率分布 p 1 , ⋯ p_1, \cdots p1,⋯, p n p_n pn 分别选择 t 1 , ⋯ , t n t_1, \cdots, t_n t1,⋯,tn 。
6.1.4 贝叶斯纳什均衡
将纳什均衡推广到不完全信息静态博弈中,基本思想与完全信息静态博弈的纳什均衡是一样的, 各博弈方的策略必须是对其他博弈方策略(或策略组合)的最佳反应。不同的是, 这里的策略比完全信息静态博弈复杂一些,不是简单的行为选择,而是由类型决定行为选择的函数。这种策略有新含义的纳什均衡, 称为 “贝叶斯纳什均衡”。
定义在不完全信息静态博弈
G
=
{
A
1
,
⋯
,
A
n
;
T
1
,
⋯
,
T
n
G=\left\{A_1, \cdots, A_n ; T_1, \cdots, T_n\right.
G={A1,⋯,An;T1,⋯,Tn;
p
1
,
⋯
,
p
n
;
u
1
,
⋯
,
u
n
}
\left.p_1, \cdots, p_n ; u_1, \cdots, u_n\right\}
p1,⋯,pn;u1,⋯,un} 中, 如果对任意博弈方
i
i
i 和他的每一种可能的类型
t
i
∈
T
i
t_i \in T_i
ti∈Ti, 策略函数
S
i
∗
(
t
i
)
S_i^*\left(t_i\right)
Si∗(ti) 所对应的行动
a
i
a_i
ai 都能最大化其期望得
益:
max
a
i
∈
A
i
∑
t
=
i
{
u
i
[
S
i
∗
(
t
1
)
,
⋯
,
S
i
−
1
∗
,
a
i
,
S
i
+
1
∗
(
t
i
+
1
)
,
⋯
,
S
n
∗
(
t
n
)
,
t
i
]
p
(
t
−
i
∣
t
i
)
}
\max _{a_i \in A_i} \sum_{t=i}\left\{u_i\left[S_i^*\left(t_1\right), \cdots, S_{i-1}^*, a_i, S_{i+1}^*\left(t_{i+1}\right), \cdots, S_n^*\left(t_n\right), t_i\right] p\left(t_{-i} \mid t_i\right)\right\}
ai∈Aimaxt=i∑{ui[Si∗(t1),⋯,Si−1∗,ai,Si+1∗(ti+1),⋯,Sn∗(tn),ti]p(t−i∣ti)}
则称策略组合
S
∗
=
(
S
1
∗
,
⋯
,
S
n
∗
)
S^*=\left(S_1^*, \cdots, S_n^*\right)
S∗=(S1∗,⋯,Sn∗) 为
G
G
G 的一个 (纯策略) 贝叶斯纳什均衡。
另:即使某博弈方清楚自己的实际类型 t i t_i ti,但仍需对每种可能类型 t i ∈ T i t_i\in T_i ti∈Ti都设定行动:因为别的博弈方的行为要根据本博弈方的不同类型来计算
例:
![]()
6.2 暗标拍卖
-
假设:
(1) 两投标者:博弈方1、博弈方 2
(2) 两博弈方对拍品估价: v 1 , v 2 v_1, v_2 v1,v2
(3) 若标价 b i b_i bi 中标, 其得益: v i − b i v_i-b_i vi−bi
(4) 各博弈方不知对方估价, 但知对方估价是 [ 0 , 1 ] [0,1] [0,1] 上的均匀分布,即取 [ 0 , 1 ] [0,1] [0,1] 中任何数值的概率相等。
(5) 博弈方都风险中性:一单位期望得益和一单位确定性得益价值相同。 -
表示为不完全信息静态博弈
把上述问题表示为标准的不完全信息静态博弈, 需要找出两个博弈方的行为空间、类型空间、判断和得益函数。
-
行为空间:博弈方 i i i的行为就是自己的标价 b i b_i bi,其中 0 ≤ b i ≤ v i ≤ 1 0\leq b_i\leq v_i\leq 1 0≤bi≤vi≤1
-
类型空间:博弈方 i i i 的类型即自己的估价 v i v_i vi, 类型空间 T i T_i Ti 就是 估价可能取值区间 [ 0 , 1 ] [0,1] [0,1]
-
判断:博弈方知道对方的类型是 [ 0 , 1 ] [0,1] [0,1] 上的 标准分布, 这就是他们对对方类型的判断。
-
得益函数:
u i = u i ( b 1 , b 2 , v 1 , v 2 ) = { v i − b i , 当 b i > b j ( v i − b i ) / 2 , 当 b i = b j 0 , 当 b i < b j u_i=u_i\left(b_1, b_2, v_1, v_2\right)=\left\{\begin{array}{c} v_i-b_i, \text { 当 } b_i>b_j \\ \left(v_i-b_i\right) / 2, \text { 当 } b_i=b_j \\ 0, \text { 当 } b_i<b_j \end{array}\right. ui=ui(b1,b2,v1,v2)=⎩ ⎨ ⎧vi−bi, 当 bi>bj(vi−bi)/2, 当 bi=bj0, 当 bi<bj
式中 i = 1 i=1 i=1 时 j = 2 , i = 2 j=2, i=2 j=2,i=2 时 j = 1 j=1 j=1 。
-
-
寻找贝叶斯纳什均衡
-
先要构筑两博弈方的策略空间,即根据类型决定行为的函数关系:
本博弈中, 博弈方 i i i 的策略是符合要求的函数关系 b i ( v i ) b_i\left(v_i\right) bi(vi), 所有这种函数关系 b i ( v i ) b_i\left(v_i\right) bi(vi) 的集合构成博弈方 i i i 的策略空间。
-
分析贝叶斯均衡
策略组合 [ b 1 ( v 1 ) , b 2 ( v 2 ) ] \left[b_1\left(v_1\right), b_2\left(v_2\right)\right] [b1(v1),b2(v2)] 是一个贝叶斯纳什均 衡, 意味着博弈方 1 的策略 b 1 ( v 1 ) b_1\left(v_1\right) b1(v1) 与博弈方 2 的策略 b 2 ( v 2 ) b_2\left(v_2\right) b2(v2) 相互是对对方的最佳反应,对每个博弈方 i i i 的每个类型 v i ∈ [ 0 , 1 ] , b i ( v i ) v_i \in[0,1], b_i\left(v_i\right) vi∈[0,1],bi(vi) 都满足中标的期望得益最大化:
Max b i { [ v i − b i ( v i ) ] P ( b i > b j ) + 1 / 2 [ v i − b i ( v i ) ] P ( b i = b j ) } \operatorname{Max}_{b_i}\left\{\left[v_i-b_i\left(v_{\mathrm{i}}\right)\right] P\left(b_i>b_j\right)+1 / 2\left[v_i-b_i\left(v_{\mathrm{i}}\right)\right] P\left(b_i=b_j\right)\right\} Maxbi{[vi−bi(vi)]P(bi>bj)+1/2[vi−bi(vi)]P(bi=bj)}
-
-
实例:线性策略函数的贝叶斯纳什均衡
-
假设博弈方的报价:由基价和估价的一个固定比例组成,即:
b 1 ( v 1 ) = a 1 + c 1 v 1 , b 2 ( v 2 ) = a 2 + c 2 v 2 b_1\left(v_1\right)=a_1+c_1 v_1, \quad b_2\left(v_2\right)=a_2+c_2 v_2 b1(v1)=a1+c1v1,b2(v2)=a2+c2v2
其中 a 1 < 1 、 a 2 < 1 a_1<1 、 a_2<1 a1<1、a2<1; c 1 ≥ 0 、 c 2 ≥ 0 c_1 \geq 0 、 c_2 \geq 0 c1≥0、c2≥0 -
简化:由于 v j v_j vj 服从标准分布, b j = b j ( v j ) = a j + c j v j b_j=b_j\left(v_j\right)=a_j+c_jv_j bj=bj(vj)=aj+cjvj, 也服从标准分布, 因此 P { b i = b j } = 0 P\left\{b_i=b_j\right\}=0 P{bi=bj}=0(概率趋近于0) 。这样上式变为:
max b i ( v i − b i ) P { b i > a j + c j v j } = max b i ( v i − b i ) P { v j < b i − a j c j } = max b i ( v i − b i ) b i − a j c j \begin{aligned} & \max _{b_i}\left(v_i-b_i\right) P\left\{b_i>a_j+c_j v_j\right\} \\ = & \max _{b_i}\left(v_i-b_i\right) P\left\{v_j<\frac{b_i-a_j}{c_j}\right\} \\ = & \max _{b_i}\left(v_i-b_i\right) \frac{b_i-a_j}{c_j} \end{aligned} ==bimax(vi−bi)P{bi>aj+cjvj}bimax(vi−bi)P{vj<cjbi−aj}bimax(vi−bi)cjbi−aj
求一阶导可得: b i = ( a j + v i ) / 2 b_i=\left(a_j+v_i\right) / 2 bi=(aj+vi)/2 -
分析:
当 v i < a j v_i<a_j vi<aj (博弈方 i i i 估价小于博弈方 j j j 的基价)则博弈方 i i i 一定不会中标,所以 v i v_i vi大小至少为 a j a_j aj才有希望,综合来看, v i v_i vi的最佳反应为:
b i ( v i ) = { v i + a j 2 当 v i ⩾ a j a j 当 v i < a j b_i\left(v_i\right)= \begin{cases}\frac{v_i+a_j}{2} & \text { 当 } v_i \geqslant a_j \\ a_j & \text { 当 } v_i<a_j\end{cases} bi(vi)={2vi+ajaj 当 vi⩾aj 当 vi<aj
若要求双方策略是严格的线性函数,可以要求 a j ≤ 0 a_j \leq 0 aj≤0,这样 v i v_i vi的最佳反应变为:
b i ( v i ) = v i + a j 2 b_i\left(v_i\right)=\frac{v_i+a_j}{2} bi(vi)=2vi+aj
将此式与之前的策略空间 b i ( v i ) = a i + c i v i b_i\left(v_i\right)=a_i+c_i v_i bi(vi)=ai+civi相比较,最终可得$a_i=a_j / 2, c_i=1 / 2 $,另一个博弈方同理,联立得最终结果:
a i = a j = 0 , c i = c j = 1 / 2 a_i=a_j=0, c_i=c_j=1 / 2 ai=aj=0,ci=cj=1/2
计算出 b i = v i / 2 b_i=v_i/2 bi=vi/2,即博弈方最佳策略:把报价定为对拍品估价的一半。
-
上述贝叶斯纳什均衡是在上述暗标拍卖博弈中, 双方采用线性策略时唯一的贝叶斯纳什均衡。如果没有限定采用线性策略, 贝叶斯纳什均衡会发生改变。如果博弈方估价的概率分布不是上述标准分布, 暗标拍卖博弈的贝叶斯纳什均衡也会发生变化。此外,参与投标人数更多时情况也要更复杂一些,但分析思路是相同的。
Summary
此部分用于对所学内容的快速梳理记忆
-
不完全信息静态博弈和贝叶斯纳什均衡
-
暗标拍卖和古诺模型两个例子的简要介绍
-
一般表示方法 G = { A , T , p , u } G=\{A,T,p,u\} G={A,T,p,u}
-
海撒尼均衡的四个转化步骤
- 引进博弈方自然
- 表示不完全信息
- 博弈方进行静态博弈
- 表示得益
-
贝叶斯纳什均衡:一种更强的概念:
如果对任意博弈方 i i i 和他的每一种可能的类型 t i ∈ T i t_i \in T_i ti∈Ti, 策略函数 S i ∗ ( t i ) S_i^*\left(t_i\right) Si∗(ti) 所对应的行动 a i a_i ai 都能最大化其期望得益
max a i ∈ A i ∑ t = i { u i [ S i ∗ ( t 1 ) , ⋯ , S i − 1 ∗ , a i , S i + 1 ∗ ( t i + 1 ) , ⋯ , S n ∗ ( t n ) , t i ] p ( t − i ∣ t i ) } \max _{a_i \in A_i} \sum_{t=i}\left\{u_i\left[S_i^*\left(t_1\right), \cdots, S_{i-1}^*, a_i, S_{i+1}^*\left(t_{i+1}\right), \cdots, S_n^*\left(t_n\right), t_i\right] p\left(t_{-i} \mid t_i\right)\right\} ai∈Aimaxt=i∑{ui[Si∗(t1),⋯,Si−1∗,ai,Si+1∗(ti+1),⋯,Sn∗(tn),ti]p(t−i∣ti)}
联想古诺模型中的 max q 1 { θ [ a − q 1 − q 2 ∗ ( c H ) − c 1 ] q 1 + ( 1 − θ ) [ a − q 1 − q 2 ∗ ( c L ) − c 1 ] q 1 } \max _{q_1}\left\{\theta\left[a-q_1-q_2^{*}\left(c_H\right)-c_1\right] q_1+(1-\theta)\left[a-q_1-q_2^*({c_L})-c_1\right] q_1\right\} maxq1{θ[a−q1−q2∗(cH)−c1]q1+(1−θ)[a−q1−q2∗(cL)−c1]q1}求和实际上是求期望
-
-
暗标拍卖
- 从行为空间、类型空间、判断、得益函数四个方面去考虑,表示成不完全信息博弈
- 进行贝叶斯纳什均衡分析,首先要构筑博弈方的策略空间,之后进行分析。