【数学建模笔记 07】数学建模的对策论

最新推荐文章于 2023-01-02 23:25:18 发布

Koorye

最新推荐文章于 2023-01-02 23:25:18 发布

阅读量1.2k

点赞数 2

分类专栏：数学建模文章标签：数学建模 python 线性规划博弈论

本文链接：https://blog.csdn.net/weixin_45901207/article/details/119089245

版权

数学建模专栏收录该内容

16 篇文章 21 订阅

订阅专栏

07. 对策论

定义

对策论亦称竞赛论或博弈论，是研究具有斗争或竞争性质现象的数学理论和方法。

基本要素：

局中人：在一个对策行为中，有权决定自己行动方案的对策参加者，通常用 $I$ 表示局中人集合；
策略集：一局对策中，可供局中人选择的一个实际可行的完整行动方案称一个策略，每个局中人 $i,i\in I$ 都有自己的策略集 $S_i$ ；
赢得函数 (支付函数)：一局对策中，各局中人所选定的策略形成的策略组称一个局势，即若 $s_i$ 是第 $i$ 个局中人的一个策略，则策略组
$s=(s_1,s_2,\dots,s_n),$
就是一个局势。全体局势的集合可用各局中人策略集的笛卡尔积表示，即
$S=S_1\times S_2\times\dots\times S_n,$
对任意局势 $s\in S$ ，局中人 $i$ 可以得到一个赢得 $H_i(s)$ ，称赢得函数。

零和对策 (矩阵对策)

零和对策是一类特殊的对策问题，只有两名局中人，每个局中人都只有有限个策略可供选择。在任一纯局势下，两个局中人的赢得之和总是等于 0。

设局中人 1、2 的策略集
$S_1=\{\alpha_1,\dots,\alpha_m\},S2=\{\beta_1,\dots,\beta_n\}.$
当局中人 1 选定策略 $\alpha_i$ ，局中人 2 选定策略 $\beta_j$ 后，就形成局势 $(\alpha_i,\beta_j)$ 。对任一局势 $(\alpha_i,\beta_j)$ ，记局中人 1 的赢得为 $a_{ij}$ ，称
$A=\begin{pmatrix} a_{11}&a_{12}&\dots&a_{1n} \\ a_{21}&a_{22}&\dots&a_{2n} \\ \vdots&\vdots&\ddots&\vdots \\ a_{m1}&a_{m2}&\dots&a_{mn} \\ \end{pmatrix}$
为局中人 1 的赢得矩阵，由于对策零和，因此局中人 2 的赢得矩阵就是 $- A$ 。

因此记零和对策为
$G=\{S_1,S_2;A\}.$

稳定解和最优纯策略

设 $G=\{S_1,S_2;A\}$ 为矩阵对策，其中 $S_1=\{\alpha_1,\dots,\alpha_m\},S2=\{\beta_1,\dots,\beta_n\}$ , $A=(a_{ij})_{m\times n}$ ，若等式
$max_i\min_ja_{ij}=\min_j\max_ia_{ij}=a_{i^*j^*}$
成立，则称 $(\alpha_{i^*},\beta_{j^*})$ 为 $G$ 的稳定解， $a_{i^*},b_{j^*}$ 分别为局中人 1、2 的最优纯策略。

如何理解上述定理？

对于前者 $max_i\min_ja_{ij}$ ，表示局中人 1 在策略中坏中取优，即计算所有策略的最坏结果，再从中挑选最好的一个策略。

对于后者 $min_j\max_ia_{ij}$ ，表示局中人 2 同样坏中取优，只不过局中人 2 的赢得矩阵为 $- A$ ，因此先取大再取小，原式可以化为
$max_j\min_i-a_{ij}.$
如果两者相等，说明存在一个形势，当局中人 1 取其最优纯策略时，局中人 2 取其他策略都比取其最优纯策略时收益小 (同样，局中人 1 的收益大)；反之亦然。即对于任意 $i, j$ ，有
$a_{ij^*}\le a_{i^*j^*}\le a_{i^*j}.$

混合策略

然而很多时候，等式
$max_i\min_ja_{ij}=\min_j\max_ia_{ij}$
并不成立，此时不存在稳定解和最优纯策略。引入混合策略。

设局中人 1 选用策略 $\alpha_i$ 的概率为 $x_i$ ，局中人 2 选用策略 $\beta_i$ 的概率为 $y_i$ ，记
$x=(x_1,\dots,x_m)^T,y=(y_1,\dots,y_n)^T$
则局中人 1 的期望赢得为
$E(x,y)=x^TAy.$
则有向量 $\overline{x},\overline{y}$ 使得等式
$\overline{x}^TA\overline{y}=\max_x\min_y x^TAy=\min_y\max_xx^TAy$
成立，此时 $(\overline{x},\overline{y})$ 即为稳定解。

线性规划求稳定解

对于
$max_x\min_y x^TAy,$
将混合策略 $y$ 看作纯策略 $j$ ，可以化为
$\max_x\min_j\sum_{i=1}^ma_{ij}x_i.$
记 $u=\min_j\sum_{i=1}^ma_{ij}x_i$ ，则 $\overline{x}$ 即为线性规划问题
$\max u,$

$s.t.\left\{\begin{aligned} &\sum_{i=1}^ma_{ij}x_i\ge u,j=1,2,\dots,n,\\ &\sum_{i=1}^m x_i=1,\\ &x_i\ge 0,i=1,2,\dots,m. \end{aligned}\right.$

的解，同理 $\overline{y}$ 即为线性规划问题
$\min v,$

$s.t.\left\{\begin{aligned} &\sum_{j=1}^na_{ij}y_j\le v,i=1,2,\dots,m,\\ &\sum_{j=1}^n y_j=1,\\ &y_j\ge 0,j=1,2,\dots,n. \end{aligned}\right.$

的解。

例子与 Python 代码

对赢得矩阵
$A=\begin{pmatrix} 3&0&2&0\\ 0&2&1&5\\ 1&2&3&4 \end{pmatrix}$
求局中人 1、2 的混合策略。

选取局中人 1，化为线性规划问题
$\max u,$

$s.t.\left\{\begin{aligned} &3x_1+x_3\le u,\\ &2x_2+2x_3\le u,\\ &2x_1+x_2+3x_3\le u,\\ &5x_2+4x_3\le u,\\ &x_1+x_2+x_3=1,\\ &x_i\ge 0,i=1,2,3. \end{aligned}\right.$

选取局中人 2，化为线性规划问题
$\min v,$

$s.t.\left\{\begin{aligned} &3y_1+2y_3\le v,\\ &2y_2+y_3+5y_4\le v,\\ &y_1+2y_2+3y_3+4y_4\le v,\\ &y_1+y_2+y_3+y_4=1,\\ &y_i\ge0,i=1,2,3,4. \end{aligned}\right.$

使用 Python 求解上述问题，代码如下：

#! /usr/bin/env python
# -*- coding: utf-8 -*-
# @ author: Koorye
# @ date: 2021-7-25
# @ function: 使用 cvxpy 包进行矩阵对策混合策略求解

# %%

import numpy as np
import cvxpy as cp

# %%

# 赢得矩阵
A = np.array([[3, 0, 2, 0],
              [0, 2, 1, 5],
              [1, 2, 3, 4]])

# %%

# 不等式约束形如 A * x <= b
A1 = A.copy().T
A2 = A.copy()

# 决策变量
x = cp.Variable(A1.shape[1]+1)
y = cp.Variable(A2.shape[1]+1)

# 约束条件
con1 = [
    A1 @ x[:-1] >= x[-1],
    sum(x[:-1]) == 1,
    x[:-1] >= 0,
]
con2 = [
    A2 @ y[:-1] <= y[-1],
    sum(y[:-1]) == 1,
    y[:-1] >= 0,
]

# 目标函数
obj1 = cp.Maximize(x[-1])
obj2 = cp.Minimize(y[-1])

# %%

p1 = cp.Problem(obj1, con1)
p2 = cp.Problem(obj2, con2)
p1.solve(solver='GLPK_MI', verbose=True)
p2.solve(solver='GLPK_MI', verbose=True)

# %%

print('x =', x.value[:-1])
print('y =', y.value[:-1])
print('x exp =', x.value[-1])
print('y exp =', y.value[-1])

输出如下：

x = [ 0.25 -0.    0.75]
y = [ 0.5  0.5 -0.  -0. ]
x exp = 1.5
y exp = 1.5

于是有
$\overline{x}=(0.25,0,0.75),\overline{y}=(0.5,0.5,0,0),E(\overline{x},\overline{y})=1.5.$

Koorye

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
【数学建模笔记 07】数学建模的对策论

07. 对策论定义对策论亦称竞赛论或博弈论，是研究具有斗争或竞争性质现象的数学理论和方法。基本要素：局中人：在一个对策行为中，有权决定自己行动方案的对策参加者，通常用 III 表示局中人集合；策略集：一局对策中，可供局中人选择的一个实际可行的完整行动方案称一个策略，每个局中人 i,i∈Ii,i\in Ii,i∈I 都有自己的策略集 SiS_iSi；赢得函数 (支付函数)：一局对策中，各局中人所选定的策略形成的策略组称一个局势，即若 sis_isi 是第 iii 个局中人的一个
复制链接

扫一扫

专栏目录