演化博弈论基本概念

luyi12138

已于 2022-11-22 21:49:20 修改

阅读量2.5k

点赞数 26

分类专栏：演化博弈论

于 2022-08-15 22:42:08 首次发布

本文链接：https://blog.csdn.net/ehsdhgd/article/details/126351278

版权

混合策略博弈论最优反应单纯形期望收益

关键词由CSDN通过智能技术生成

演化博弈论专栏收录该内容

11 篇文章

订阅专栏

本文深入探讨了博弈论中的混合策略，包括其几何空间、收益函数及最优反应。混合策略通过概率分配在纯策略上，形成一个策略集合的凸包。最优反应是指面对对手策略时，最大化收益的策略选择。文章还介绍了如何用矩阵表示行博弈方与列博弈方的收益，并定义了最佳反应集合的概念。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

混合策略

符号

标准博弈可以写成： $G=(I,S,\pi)$
博弈方集合： $I = (1, 2, 3 . . ., n)$ ,n为博弈方数目
有限纯策略集合： $S_i= \{1,2,...,m_i\}$ ， $m_i$ 为博弈方能够采取的策略数目
纯策略空间： $S=X_iS_i，X_i$ 表示卡特尔积

对卡特尔积举个栗子
两个人进行剪刀石头布的游戏
$I=2,S_i=\{剪刀，石头，布\},$
$S=\{(剪刀，剪刀)，(剪刀，石头)，(剪刀，布)，(石头，石头)，(石头，剪刀)，(石头，布),(布，布)，(布，剪刀)，(布，石头)\}$

对于任何策略组合S，博弈方I的收益可以记为 $\pi_i(s)$ ， $\pi_i(s)$ 应该也可以写成 $\pi_i:S\rightarrow R$
$\pi_i:S\rightarrow R$ 为集值映射，意思为S中的每个策略，都可以对应成R中的每一个子集。

混合策略的空间几何

$x_i$ 的支集(或承载形)： $C(x_i)=\{h\in S_i:x_{ih}>0\}$
即为某混合策略 $x_i$ 赋予正概率的纯策略的集合
比如：策略集={剪刀，石头，布}，混合策略 $x_i=(1/2,1/2,0)$
则 $C(x_i)=\{剪刀，石头\}$

单纯形 $\Delta_i=\{x_i \in R_+^{m_i}:\Sigma_{h=1}^{m_i}x_{ih}=1\}$
$\Delta_i$ 的顶点为 $m_i$ 维空间的单位向量(表示某个纯策略)
混合策略单纯形 $\Delta_i$ 是所有顶点的凸包。
每个混合策略 $x_i$ 是纯策略 $e_i^h$ 的凸组合。
凸集，凸组合，凸包，仿射组合：
凸包：S为欧式空间 $R^n$ 的任意子集，包含S的最小凸集称为S的凸包。请添加图片描述
内部： $(\Delta_i)=\{x_i\in \Delta_i:x_{ih}>0,\forall h\}$
外部： $bd(\Delta_i)=\{x_i\in \Delta_i:x_i\notin int(\Delta_i)\}$
其中， $x_i$ 为某个混合策略， $h\in S_i$ 即为第几个策略。
混合策略空间 $\Theta=X_{i\in I}\Delta_i$ (单纯形是某个博弈方的策略集合，策略空间是每个博弈方策略的笛卡尔积)
$int\Theta=X_{i\in I} int(\Delta_i)$
当且仅当C(x)=S(任意 $x_{ih}$ 均大于0),对于 $x\in \Theta:x\in int(\Theta)$ 的支集，记为 $C(x)=X_{i\in I}C(X_i)\subset S$

如果子集 $X\subset \Theta$ 是各博弈方的笛卡尔积，那么X称为 $\Theta$ 的面，特别的， $X=\Theta$ 是 $\Theta$ 的一个面，而且是最大的一个面
每一个纯策略组合，可以视为 $\Theta$ 的一个单点子集，是一个边界面
$\Theta$ 的边界面的并等同于集合 $bd(\Theta)$

策略组合的表示

博弈方i采取策略 $x_i\in \Delta_i$ ,其他所有博弈方j按照策略组合 $y\in\Theta$ 来行动，将此策略表示为： $z=(x_i,y_{-i})$

混合策略收益函数

某个纯策略s被采用的概率就是每个博弈方的混合策略赋予他纯策略的概率之积
$x(s)=\prod_{i=1}^nx_{is_i}$
比如：
$\left [ \begin{matrix} 1 & 2 \\ 4 & 5 \end{matrix} \right ]$
行博弈方策略 $x_i=(1/3,2/3)$ ,列博弈方策略 $y_i=(1/2,1/2)$
则S={1,2}被采用的概率为 $1 / 6$
混合策略组合带给博弈方的期望收益值为
$u_i(x)=\Sigma_{s\in S}x(s)\pi_i(s)$
若将博弈方j运用第k个纯策略时博弈方i的收益记作 $u_i(e_j^k,x_{-j})$
对任何的 $x\subset\Theta$ 和 $\in I$ ， $u_i(x)=\Sigma_{k=i}^{m_i}u_i(e_j^k,x_{-j})x_{jk}$

对任何的混合策略对 $x_1 \in \Delta_1,x_2 \in \Delta_2$
有 $u_1(x)=\Sigma_{h=1}^{m_1}\Sigma_{h=2}^{m_2}x_{1h}a_{hk}x_{2k}=x_1Ax_2$
$u_2(x)=\Sigma_{h=1}^{m_1}\Sigma_{h=2}^{m_2}x_{1h}b_{hk}x_{2k}=x_1Bx_2=x_2B^Tx_1$