对策问题
对策问题的特征
参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取策略的综合结果
对策的基本要素
(1)局中人:在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。通常用 I 表示局中人的集合.如果有n个局中人,则 I = {1,2,…,n}。
(2)策略集:供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一局中人i ,i ∈ \in ∈ I ,都有自己的策略集 S i S_i Si。
(3)支付函数:局中人所选定的策略形成的策略组称为一个局势 S i S_i Si,全体局势的集合S可用各局中人策略集的笛卡尔积表示
零和博弈(矩阵对策)问题
零和博弈:只有两名局中人,每个局中人只有有限个策略可供选择。在任一纯局势下,两个局中人赢得之和等于0,即双方的利益是激烈对抗的(不可能同时获利)。
策略集
① 局中人Ⅰ、Ⅱ的策略集
S 1 = ( α 1 , α 2 , … , α n ) , S 2 = ( β 1 , β 2 , … , β m ) S_1=(\alpha_1,\alpha_2,\dots,\alpha_n),S_2=(\beta_1,\beta_2,\dots,\beta_m) S1=(α1,α2,…,αn),S2=(β1,β2,…,βm)
赢得矩阵
② 局中人Ⅰ的赢得矩阵(Ⅱ的支付矩阵)
共有mn个局势,对于任意局势 ( α i , β j ) (\alpha_i,\beta_j) (αi,βj),记局中人Ⅰ的赢得值为 a i j a_{ij} aij,Ⅰ的赢得矩阵为(其中Ⅰ有m个方案,Ⅱ有n个方案):
A = [ a 11 , a 12 , … , a 1 n a 21 , a 22 , … , a 2 n ⋮ , ⋮ , … , ⋮ a m 1 , a m 2 , … , a m n ] A=\begin{bmatrix} a_{11},&a_{12},&\dots,&a_{1n} \\ a_{21},&a_{22},&\dots,&a_{2n}\\ \vdots,&\vdots,&\dots,&\vdots \\ a_{m1},&a_{m2},&\dots,&a_{mn} \end{bmatrix} A=⎣⎢⎢⎢⎡a11,a21,⋮,am1,a12,a22,⋮,am2,…,…,…,…,a1na2n⋮amn⎦⎥⎥⎥⎤
局中人Ⅱ的赢得矩阵就是-A
当局中人Ⅰ、Ⅱ和策略集 S 1 , s 2 S_1,s_2 S1,s2及局中人Ⅰ的赢得矩阵A确定后,一个零和对策就给定了,零和对策又可称为矩阵对策并可简记成 G = ( S 1 , S 2 , A ) G=(S_1,S_2,A) G=(S1,S