对策论基础【提纲】

本文详细介绍了对策论的基础知识,重点讲解了二人有限零和对策,包括矩阵对策的概念、平衡局势的充要条件、最优混合策略的存在性及其性质。此外,还提及了二人无限零和对策和多人非合作对策的平衡策略。通过对策论,可以解决决策问题并找到最佳决策策略。
摘要由CSDN通过智能技术生成

§15 对策论基础

C1 对策

1)基本要素:

  • 局中人 I I I:决策行动的参与者
  • 策略集 S i , i ∈ I S_i,i\in I Si,iI:每一位参与者的决策行为集合
  • 局势集:笛卡尔积 S = S 1 × S 2 × ⋯ × S n S = S_1 \times S_2\times \dots\times S_n S=S1×S2××Sn
  • 获利/支付函数:评价某一局势下参与者的获利 H i ( s ) , s = ( s 1 , s 2 , … , s n ) H_i(s),s = (s_1,s_2,\dots ,s_n) Hi(s),s=(s1,s2,,sn)

2)决策问题的分类:

  • 局中人个数:二人对策、多人对策
  • 获利函数代数和:零和对策、非零和对策
  • 局中人策略集是否有限:有限对策、无限对策
  • 是否合作:合作对策、非合作对策

C2 矩阵对策

1)矩阵对策二人 有限 零和 对策

  • 记法约定:局中人Ⅰ Ⅱ,策略集 S 1 = { α 1 , α 2 , … , α m } , S 2 = { β 1 , β 2 , … β n } S_1 = \{\alpha_1,\alpha_2,\dots,\alpha_m\},S_2 = \{\beta_1 ,\beta_2 ,\dots \beta_n\} S1={ α1,α2,,αm},S2={ β1,β2,βn},获利矩阵 A = ( a i j ) m × n , a i j = H ( s i , s j ) , B = − A T A = (a_{ij})_{m\times n},a_{ij} = H(s_i,s_j),B= - A^T A=(aij)m×n,aij=H(si,sj),B=AT。对策: G = { Ⅰ , Ⅱ ; S 1 , S 2 , A } G = \{Ⅰ,Ⅱ;S_1,S_2,A\} G={ ,;S1,S2,A}

2)平衡局势 ∃ a i ∗ j ∗ : max ⁡ i min ⁡ j a i j = a i ∗ j ∗ = min ⁡ j max ⁡ i a i j \exist a_{i^*j^*} :\max \limits_{i} \min \limits_{j} {a_{ij}} = a_{i^*j^*} = \min\limits_{j}\max\limits_{i} {a_{ij}} aij:imaxjminaij=aij=jminimaxaij

  • V G = a i ∗ j ∗ V_G = a_{i^*j^*} VG=aij矩阵对策G的值,对应的 α i ∗ , β j ∗ \alpha_{i^*},\beta_{j^*} αi,βj最优纯策略

  • 平衡局势存在的充要条件: ∃ a i ∗ j ∗ : ∀ i , j , a i j ∗ ≤ a i ∗ j ∗ ≤ a i ∗ j \exist a_{i^*j^*}:\forall i,j,a_{ij^*}\le a_{i^*j^*}\le a_{i^*j} aij:i,j,aijaijaij(行中最小列中最大),即存在鞍点

  • 鞍点性质:

    • 无差别性:两鞍点的获利取值相同
    • 可交换性:若 a i 1 j 1 , a i 2 j 2 a_{i_1j_1},a_{i_2j_2} ai1j1,ai2j2是鞍点,则 a i 1 j 2 , a i 2 j 1 a_{i_1j_2},a_{i_2j_1} ai1j2,ai2j1也是鞍点

3)混合策略:允许策略为策略集集上一个概率分布。

  • 策略集: S ∗ = { x ∈ E m ∣ x i ≥ 0 , i = 1 , 2 , … , m , ∑ i = 1 m = 1 } S^* = \{x\in E^m |x_i\ge0,i=1,2,\dots,m,\sum_{i=1}^m = 1\} S={ xEmxi0,i=1,2,,m,i=1m=1}
  • 获利函数: E ( x , y ) = x T A   y = ∑ i ∑ j a i j x i y j E(x,y) = x^TA \ y = \sum\limits_{i}\sum\limits_j a_{ij}x_iy_j E(x,y)=xTA y=ijaijxiyj
  • 显然,纯策略是 x i ∈ { 0 , 1 } x_i \in\{0,1\} xi{ 0,1}的特例
  • 平衡局势: max ⁡ x ∈ S 1 ∗ min ⁡ y ∈ S 2 ∗ E ( x , y ) = min ⁡ y ∈ S 2 ∗ max ⁡ x ∈ S 1 ∗ E ( x , y )    ⟺    ∃ x ∗ , y ∗ : ∀ x , y , E ( x , y ∗ ) ≤ E ( x ∗ , y ∗ ) ≤ E ( x ∗ , y ) \max\limits_{x\in S_1^*}\min\limits_{y\in S_2^*} {E(x,y)} = \min\limits_{y\in S_2^*}\max\limits_{x\in S_1^*}{E(x,y)} \iff \exist x^*,y^*:\forall x,y,E(x,y^*)\le E(x^*,y^*) \le E(x^*,y) xS1maxyS2minE(x,y)=yS2minxS1maxE(x,y)x,
  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值