1、博弈论的定义
博弈过程主要由三个基本要素定义,分别是:参与者集合、所有参与者的策略集合(取决于参与者可以釆取行动的约束条件)和参与者效用集合。具体可以公式化为以下形式:
G
=
[
N
,
(
X
i
)
i
∈
N
,
(
u
i
)
i
∈
N
]
G=[N,(X_i)_{i\in N},(u_i)_{i\in N}]
G=[N,(Xi)i∈N,(ui)i∈N]
其中,
N
=
1
,
2
,
.
.
.
,
n
N={1,2,...,n}
N=1,2,...,n表示博弈问题
G
G
G中的参与者集合,
N
N
N表示参与者个数且
n
n
n为
有限值;
X
X
X表示第
i
i
i个参与者的策略集合;
u
i
u_i
ui表示第
i
i
i个参与者的效用函数,效用函数是用来衡量参与者从博弈过程中受益的一个指标,不仅依赖于参与者自身的策略选择,也与其他参与者的策略选择相关。需要注意的是,参与者、策略集合
和效用函数是博弈框架中必不可少的三要素。
2、纳什均衡
纳什均衡在非合作博弈问题中是一个非常重要的概念。当参与博弈的参与者的博弈策略选择达到纳什均衡时,任何一个参与博弈过程的理性的参与者都不会试图再改变自身策略,也就是说,在纳什均衡点,每个参与的博弈策略选择是对其他参与者选择策略的最佳响应。
给定一个
n
n
n人策略型博弈(非合作博弈)
G
=
S
1
,
S
2
,
.
.
.
,
S
n
;
u
1
,
u
2
,
.
.
.
,
u
n
G={S_1,S_2,...,S_n;u_1,u_2,...,u_n}
G=S1,S2,...,Sn;u1,u2,...,un中,策略组合
s
∗
=
(
s
1
∗
,
s
2
∗
,
.
.
.
,
s
i
∗
,
.
.
.
,
s
n
∗
)
s^*=(s_1^*,s_2^*,...,s_i^*,...,s_n^*)
s∗=(s1∗,s2∗,...,si∗,...,sn∗)是一个纳什均衡,当且仅当
∀
i
∈
N
\forall i\in N
∀i∈N、
s
i
∈
S
i
s_i\in S_i
si∈Si满足:
u
i
(
s
i
∗
,
s
−
i
∗
)
≥
u
i
(
s
i
,
s
−
i
∗
)
u_i(s_i^*,s_{-i}^*)\geq u_i(s_i,s_{-i}^*)
ui(si∗,s−i∗)≥ui(si,s−i∗)
其中,
N
=
1
,
2
,
.
.
.
,
n
N={1,2,...,n}
N=1,2,...,n表示博弈问题
G
G
G中的参与者集合,
s
i
∗
s_i^*
si∗是给定其他参与者选择
s
−
i
∗
=
(
s
1
∗
,
s
2
∗
,
.
.
.
,
s
i
−
1
∗
,
s
i
+
1
∗
,
.
.
.
,
s
n
∗
)
s_{-i}^*=(s_1^*,s_2^*,...,s_{i-1}^*,s_{i+1}^*,...,s_n^*)
s−i∗=(s1∗,s2∗,...,si−1∗,si+1∗,...,sn∗)的情况下第
i
i
i个参与者所作出的最优策略。