1. 合作博弈概述
有 n n n 个玩家 N = { 1 , 2 , ⋯ , n } N=\{1,2,\cdots,n\} N={1,2,⋯,n},每个子集 S ⊆ N S\subseteq N S⊆N 称为一个联盟 ( N N N 被称为总联盟)。对每个联盟 S S S,对应一个成本(或收益) F ( S ) F(S) F(S)。这样的一组 ( N , F ) (N,F) (N,F) 就是一个合作博弈。
对于任何一个向量 l = ( l 1 , ⋯ , l N ) l = (l_1,\cdots, l_N) l=(l1,⋯,lN),如果 ∑ j ∈ N l j = F ( N ) \mathop{\sum}\limits_{j\in N}l_j = F(N) j∈N∑lj=F(N),则称 l l l 为合作博弈 ( N , F ) (N,F) (N,F) 的一个分配(allocation)。如果进一步,对任何 S ⊆ N S\subseteq N S⊆N,有 ∑ j ∈ S l j ≤ F ( S ) \mathop{\sum}\limits_{j\in S}l_j \leq F(S) j∈S∑lj≤F(S),则称 l l l 属于合作博弈 ( N , F ) (N,F) (N,F)的核(core)。合作博弈的核,是一个很强的概念,并不是所有的合作博弈都存在,它要求每个子联盟的成员都没有脱离联盟的动机。
定义. 一个向量
l
=
(
l
i
S
)
i
∈
S
,
S
⊆
N
l= (l_i^S)_{i\in S, S\subseteq N}
l=(liS)i∈S,S⊆N 称为一个合作博弈
(
N
,
F
)
(N,F)
(N,F) 的一个种群单调分配机制(population monotonic allocation scheme,PMAS),如果它满足下面两个条件:
(1) 向量
(
l
i
S
)
i
∈
S
(l_i^S)_{i\in S}
(liS)i∈S 在子联盟
(
S
,
F
∣
S
)
(S,F|_S)
(S,F∣S) 的核中;
(2) 对任何
S
⊂
T
⊂
N
S\subset T\subset N
S⊂T⊂N,有
l
i
S
≥
l
i
T
l_i^S\ge l_i^T
liS≥liT。
PMAS是一个更强的条件,目前相关的结果很少,如果能对一些经典的模型,得到PMAS的重要结果(比如证明甚至构造出PMAS),基本都是管理学和运筹学的顶级期刊。
2. 经济批量博弈
有一个零售商,在 T T T 个周期(比如春节期间,每一天可以看作一个周期)内销售某个商品。假设各个周期内的顾客需求都是确定的,记为 d = ( d 1 , ⋯ , d T ) d=(d_1, \cdots, d_T) d=(d1,⋯,dT)。零售商在各个周期内采购的成本为: c t ( z t ) = K t δ ( z t ) + c t z t c_t(z_t)=K_t\delta(z_t) + c_tz_t ct(zt)=Ktδ(zt)+ctzt,其中 z t z_t zt 表示周期 t t t 内的采购量, K t K_t Kt 为固定采购成本, c t c_t ct 为单位采购成本, δ ( z t ) = { 1 , if z t > 0 0 , otherwise . \delta(z_t)=\begin{cases} 1, & \text{if } z_t> 0 \\ 0, & \text{otherwise} \end{cases}. δ(zt)={1,0,if zt>0otherwise.
由于每个周期的单位采购成本不同,所以为了减少总的采购成本,零售商就需要考虑批量订货的策略,比如第一个周期就同时也把第二、三周期的货订购了,此时货物就会产生库存成本,记每个周期 t t t 内的单位库存成本为 h t + h_t^+ ht+。此外,零售商也可以延迟交货,比如第一周期的采购成本很高,可以将第一周期的订货量延迟到第三周期采购,此时就会产生延迟成本,记每个周期 t t t内的延迟成本为 h t − h_t^- ht−。
所谓的经济批量问题(economic lot-sizing problem)就是下面的成本最优化问题:
C
(
d
)
:
=
min
∑
t
=
1
T
{
c
t
(
z
t
)
+
h
t
+
I
t
+
+
h
t
−
I
t
−
}
s.t.
z
t
+
I
t
−
1
+
−
I
t
−
1
−
=
d
t
+
I
t
+
−
I
t
−
,
∀
t
=
1
,
⋯
,
T
I
0
+
=
I
0
−
=
0
z
t
≥
0
,
I
t
+
,
I
t
−
≥
0
,
∀
t
=
1
,
⋯
,
T
\begin{aligned} C(d) : = \min &\; \mathop{\sum}\limits_{t=1}^T \left\{ c_t(z_t) + h_t^+I_t^+ + h_t^-I_t^- \right\} \\ \text{s.t.} &\; z_t + I_{t-1}^+ - I_{t-1}^- = d_t + I_t^+ - I_t^-, & \forall t=1,\cdots, T \\ &\; I_0^+ = I_0^- = 0 \\ &\; z_t\ge 0, I_t^+ , I_t^- \ge 0, & \forall t=1,\cdots, T \end{aligned}
C(d):=mins.t.t=1∑T{ct(zt)+ht+It++ht−It−}zt+It−1+−It−1−=dt+It+−It−,I0+=I0−=0zt≥0,It+,It−≥0,∀t=1,⋯,T∀t=1,⋯,T 这里
I
t
+
I_t^+
It+ 表示
t
t
t 周期结束时的库存水平,
I
t
−
I_t^-
It− 表示
t
t
t 周期结束时的延迟交付的货物总量。
进一步考虑 n n n 个零售商,记为 N = { 1 , 2 , ⋯ , n } N=\{1,2,\cdots,n\} N={1,2,⋯,n}。为了节约成本提高竞争力,部分零售商会彼此结成联盟,共同订货,共享库存。这样,就会形成一个经济批量博弈模型 ( N , F ) (N,F) (N,F):对于任何联盟 S ⊆ N S\subseteq N S⊆N,成本函数 F ( S ) : = C ( d S ) F(S):=C(d^S) F(S):=C(dS),这里 d t S = ∑ i ∈ S d t i , d S = ( d 1 S , ⋯ , d T S ) d_t^S = \mathop{\sum}\limits_{i\in S}d_t^i, d^S=(d_1^S,\cdots,d_T^S) dtS=i∈S∑dti,dS=(d1S,⋯,dTS)是子联盟中所有成员的需求之和。