对策论基础【提纲】

最新推荐文章于 2023-10-02 16:42:37 发布

「已注销」

最新推荐文章于 2023-10-02 16:42:37 发布

阅读量475

点赞数 2

文章标签：线性规划博弈论

本文链接：https://blog.csdn.net/weixin_42935837/article/details/106205799

版权

本文详细介绍了对策论的基础知识，重点讲解了二人有限零和对策，包括矩阵对策的概念、平衡局势的充要条件、最优混合策略的存在性及其性质。此外，还提及了二人无限零和对策和多人非合作对策的平衡策略。通过对策论，可以解决决策问题并找到最佳决策策略。

摘要由CSDN通过智能技术生成

§15 对策论基础

1）基本要素：

2）决策问题的分类：

1）矩阵对策：二人有限零和对策

记法约定：局中人Ⅰ Ⅱ，策略集 $S_1 = \{\alpha_1,\alpha_2,\dots,\alpha_m\},S_2 = \{\beta_1 ,\beta_2 ,\dots \beta_n\}$ ，获利矩阵 $(a_{ij})_{m\times n},a_{ij} = H(s_i,s_j),B= - A^T$ 。对策： $G = \{Ⅰ,Ⅱ;S_1,S_2,A\}$

2）平衡局势： $\exist a_{i^*j^*} :\max \limits_{i} \min \limits_{j} {a_{ij}} = a_{i^*j^*} = \min\limits_{j}\max\limits_{i} {a_{ij}}$

称 $V_G = a_{i^*j^*}$ 为矩阵对策G的值，对应的 $\alpha_{i^*},\beta_{j^*}$ 为最优纯策略
平衡局势存在的充要条件： $\exist a_{i^*j^*}:\forall i,j,a_{ij^*}\le a_{i^*j^*}\le a_{i^*j}$ (行中最小列中最大)，即存在鞍点
鞍点性质：
- 无差别性：两鞍点的获利取值相同
- 可交换性：若 $a_{i_1j_1},a_{i_2j_2}$ 是鞍点，则 $a_{i_1j_2},a_{i_2j_1}$ 也是鞍点

3）混合策略：允许策略为策略集集上一个概率分布。

策略集： $S^* = \{x\in E^m |x_i\ge0,i=1,2,\dots,m,\sum_{i=1}^m = 1\}$
获利函数： $x^TA \ y = \sum\limits_{i}\sum\limits_j a_{ij}x_iy_j$
显然，纯策略是 $x_i \in\{0,1\}$ 的特例
平衡局势： $\max\limits_{x\in S_1^*}\min\limits_{y\in S_2^*} {E(x,y)} = \min\limits_{y\in S_2^*}\max\limits_{x\in S_1^*}{E(x,y)} \iff \exist x^*,y^*:\forall x,y,E(x,y^*)\le E(x^*,y^*) \le E(x^*,y)$

关注