§15 对策论基础
C1 对策
1)基本要素:
局中人
I I I:决策行动的参与者策略集
S i , i ∈ I S_i,i\in I Si,i∈I:每一位参与者的决策行为集合局势集
:笛卡尔积 S = S 1 × S 2 × ⋯ × S n S = S_1 \times S_2\times \dots\times S_n S=S1×S2×⋯×Sn获利/支付函数
:评价某一局势下参与者的获利 H i ( s ) , s = ( s 1 , s 2 , … , s n ) H_i(s),s = (s_1,s_2,\dots ,s_n) Hi(s),s=(s1,s2,…,sn)
2)决策问题的分类:
- 局中人个数:二人对策、多人对策
- 获利函数代数和:零和对策、非零和对策
- 局中人策略集是否有限:有限对策、无限对策
- 是否合作:合作对策、非合作对策
C2 矩阵对策
1)矩阵对策
:二人 有限 零和 对策
- 记法约定:局中人Ⅰ Ⅱ,策略集 S 1 = { α 1 , α 2 , … , α m } , S 2 = { β 1 , β 2 , … β n } S_1 = \{\alpha_1,\alpha_2,\dots,\alpha_m\},S_2 = \{\beta_1 ,\beta_2 ,\dots \beta_n\} S1={ α1,α2,…,αm},S2={ β1,β2,…βn},获利矩阵 A = ( a i j ) m × n , a i j = H ( s i , s j ) , B = − A T A = (a_{ij})_{m\times n},a_{ij} = H(s_i,s_j),B= - A^T A=(aij)m×n,aij=H(si,sj),B=−AT。对策: G = { Ⅰ , Ⅱ ; S 1 , S 2 , A } G = \{Ⅰ,Ⅱ;S_1,S_2,A\} G={ Ⅰ,Ⅱ;S1,S2,A}
2)平衡局势
: ∃ a i ∗ j ∗ : max i min j a i j = a i ∗ j ∗ = min j max i a i j \exist a_{i^*j^*} :\max \limits_{i} \min \limits_{j} {a_{ij}} = a_{i^*j^*} = \min\limits_{j}\max\limits_{i} {a_{ij}} ∃ai∗j∗:imaxjminaij=ai∗j∗=jminimaxaij
-
称 V G = a i ∗ j ∗ V_G = a_{i^*j^*} VG=ai∗j∗为
矩阵对策G的值
,对应的 α i ∗ , β j ∗ \alpha_{i^*},\beta_{j^*} αi∗,βj∗为最优纯策略
-
平衡局势存在的充要条件: ∃ a i ∗ j ∗ : ∀ i , j , a i j ∗ ≤ a i ∗ j ∗ ≤ a i ∗ j \exist a_{i^*j^*}:\forall i,j,a_{ij^*}\le a_{i^*j^*}\le a_{i^*j} ∃ai∗j∗:∀i,j,aij∗≤ai∗j∗≤ai∗j(行中最小列中最大),即存在鞍点
-
鞍点性质:
- 无差别性:两鞍点的获利取值相同
- 可交换性:若 a i 1 j 1 , a i 2 j 2 a_{i_1j_1},a_{i_2j_2} ai1j1,ai2j2是鞍点,则 a i 1 j 2 , a i 2 j 1 a_{i_1j_2},a_{i_2j_1} ai1j2,ai2j1也是鞍点
3)混合策略
:允许策略为策略集集上一个概率分布。
- 策略集: S ∗ = { x ∈ E m ∣ x i ≥ 0 , i = 1 , 2 , … , m , ∑ i = 1 m = 1 } S^* = \{x\in E^m |x_i\ge0,i=1,2,\dots,m,\sum_{i=1}^m = 1\} S∗={ x∈Em∣xi≥0,i=1,2,…,m,∑i=1m=1}
- 获利函数: E ( x , y ) = x T A y = ∑ i ∑ j a i j x i y j E(x,y) = x^TA \ y = \sum\limits_{i}\sum\limits_j a_{ij}x_iy_j E(x,y)=xTA y=i∑j∑aijxiyj
- 显然,纯策略是 x i ∈ { 0 , 1 } x_i \in\{0,1\} xi∈{ 0,1}的特例
- 平衡局势: max x ∈ S 1 ∗ min y ∈ S 2 ∗ E ( x , y ) = min y ∈ S 2 ∗ max x ∈ S 1 ∗ E ( x , y ) ⟺ ∃ x ∗ , y ∗ : ∀ x , y , E ( x , y ∗ ) ≤ E ( x ∗ , y ∗ ) ≤ E ( x ∗ , y ) \max\limits_{x\in S_1^*}\min\limits_{y\in S_2^*} {E(x,y)} = \min\limits_{y\in S_2^*}\max\limits_{x\in S_1^*}{E(x,y)} \iff \exist x^*,y^*:\forall x,y,E(x,y^*)\le E(x^*,y^*) \le E(x^*,y) x∈S1∗maxy∈S2∗minE(x,y)=y∈S2∗minx∈S1∗maxE(x,y)⟺∃x∗,