纳什均衡
如果对于所有参与人 i i i有 u i ( σ i ∗ , σ − i ∗ ) ≥ u i ( s i , σ − i ∗ ) ( s i ∈ S i ) u_i(\sigma_i^*,\sigma_{-i}^*)\ge u_i(s_i,\sigma_{-i}^*)\quad(s_i\in S_i) ui(σi∗,σ−i∗)≥ui(si,σ−i∗)(si∈Si)那么混合策略组合 σ ∗ \sigma^* σ∗是一种纳什均衡
严格纳什均衡
如果对于所有参与人 i i i有 u i ( s i ∗ , s − i ∗ ) ≥ u i ( s i , s − i ∗ ) ( s i ∈ S i ) u_i(s_i^*,s_{-i}^*)\ge u_i(s_i,s_{-i}^*)\quad(s_i\in S_i) ui(si∗,s−i∗)≥ui(si,s−i∗)(si∈Si)等号成立当且仅当 s i = s i ∗ s_i=s_i^* si=si∗
那么纯策略组合 σ ∗ \sigma^* σ∗是一种严格纳什均衡
纳什均衡计算方法
例1. 考虑以下鹰兔博弈,求所有纳什均衡
纳什均衡的意义在于利益最大化,所以仅需将利益最大化时策略间的关系求出即可
令
x
=
σ
1
(
T
)
,
y
=
σ
2
(
T
)
x=\sigma_1(T),y=\sigma_2(T)
x=σ1(T),y=σ2(T),则
σ
1
(
W
)
=
1
−
x
,
σ
2
(
W
)
=
1
−
y
\sigma_1(W)=1-x,\sigma_2(W)=1-y
σ1(W)=1−x,σ2(W)=1−y,效用为
u
1
(
σ
1
)
=
−
x
y
+
2
x
(
1
−
y
)
+
(
1
−
x
)
y
=
x
(
2
−
4
y
)
+
y
u_1(\sigma_1)=-xy+2x(1-y)+(1-x)y=x(2-4y)+y
u1(σ1)=−xy+2x(1−y)+(1−x)y=x(2−4y)+y对于
y
<
1
2
y<\frac12
y<21,
x
=
1
x=1
x=1;对于
y
>
1
2
y>\frac12
y>21,
x
=
0
x=0
x=0;对于
y
=
1
2
y=\frac12
y=21,
x
∈
[
0
,
1
]
x\in[0,1]
x∈[0,1]
x
=
{
1
,
0
≤
y
<
1
2
0
,
1
2
<
y
≤
1
x
∈
[
0
,
1
]
,
y
=
1
2
x=\begin{cases}1,&0\le y<\frac12\\0,&\frac12<y\le1\\x\in[0,1],&y=\frac12\end{cases}
x=⎩⎪⎨⎪⎧1,0,x∈[0,1],0≤y<2121<y≤1y=21
同理得到参与人二的利益最大函数
y
=
{
1
,
0
≤
x
<
1
2
0
,
1
2
<
x
≤
1
y
∈
[
0
,
1
]
,
x
=
1
2
y=\begin{cases}1,&0\le x<\frac12\\0,&\frac12<x\le1\\y\in[0,1],&x=\frac12\end{cases}
y=⎩⎪⎨⎪⎧1,0,y∈[0,1],0≤x<2121<x≤1x=21
将两个函数绘制在一个坐标系中
红色曲线为参与人一利益最大曲线,蓝色为参与人二利益最大曲线
不难看出有三个点两个参与人利益均最大,即
(
0
,
1
)
,
(
1
,
0
)
,
(
1
2
,
1
2
)
(0,1),(1,0),(\frac12,\frac12)
(0,1),(1,0),(21,21)
故此三个点对应的策略组合即为纳什均衡
例2. 在某地有两个产商垄断市场,分别生产 q 1 , q 2 q_1,q_2 q1,q2的商品。若市场价格与总产量 q = q 1 + q 2 q=q_1+q_2 q=q1+q2的关系为 p ( q ) p(q) p(q),第 i i i个厂商生产的单位成本为 c i ( q i ) c_i(q_i) ci(qi),每个产商会根据对方的产量调整自己的产量以是自己的利益最大化, p ( q ) = 1 − q p(q)=1-q p(q)=1−q, c i ( q i ) = c q i c_i(q_i)=cq_i ci(qi)=cqi( c c c为常数),求两个产商最终稳定的产量(即求纳什均衡)
第 i i i个的厂商的利润为 u i = q i p ( q ) − c i ( q i ) u_i=q_ip(q)-c_i(q_i) ui=qip(q)−ci(qi),由于利益最大,则 ∂ u i ∂ q i = q i p ′ ( q ) + p ( q ) − c i ′ ( q ) = 0 \frac{\partial u_i}{\partial q_i}=q_ip'(q)+p(q)-c_i'(q)=0 ∂qi∂ui=qip′(q)+p(q)−ci′(q)=0代入 p ( q ) = 1 − q , c i ( q i ) = c q i p(q)=1-q,c_i(q_i)=cq_i p(q)=1−q,ci(qi)=cqi得到 − q i + 1 − q − c = 0 -q_i+1-q-c=0 −qi+1−q−c=0,即 q + q i = 1 − c q+q_i=1-c q+qi=1−c,则 { 2 q 1 + q 2 = 1 − c q 1 + 2 q 2 = 1 − c \begin{cases}2q_1+q_2=1-c\\q_1+2q_2=1-c\end{cases} {2q1+q2=1−cq1+2q2=1−c解得 { q 1 = 1 − c 3 q 2 = 1 − c 3 \begin{cases}q_1=\frac{1-c}3\\q_2=\frac{1-c}3\end{cases} {q1=31−cq2=31−c
结合例题不难看出,纳什均衡的求解方法就是找出利益最大曲线,然后解出交点