博弈论解析：弱占优与严格占优，最优反应与混合策略-CSDN博客

本文链接：https://blog.csdn.net/ehsdhgd/article/details/126383154

占优关系

弱占优与严格占优

定义：

对所有的 $\in\Theta,u_i(y_i,z_{-i})\ge u_i(x_i,z_{-i})$ ，并且对于某些 $\in\Theta$ ，严格不等式成立，那么 $y_i \in \Delta_i$ 弱占优 $x_i \in \Delta_i$
对所有的 $\in\Theta,u_i(y_i,z_{-i}) > u_i(x_i,z_{-i})$ ,则有 $y_i \in \Delta_i$ 严格占优 $x_i \in \Delta_i$

简言之，博弈方1采取混合策略x时，其收益不小于采取混合策略y时的收益，则称为策略x弱占优y；博弈方1采取混合策略x时，其收益大于采取混合策略y时的收益，则称为策略x严格占优y；

重复剔除严格占优

这是反复剔除严格被占优策略的过程，比如：
$A=\left[\begin {matrix} 3 & 0\\ 0 & 3\\ 1 &1 \end{matrix} \right]$
$x_1=e_1^3\in\Delta_1,y_1=(\frac{1}{2},\frac{1}{2},0)\in\Delta_1$ ,计算 $u_1(x_1,z_2)=1,u_1(y_1,z_2)=\frac{1}{2}\cdot x\cdot3+\frac{1}{2}\cdot3\cdot(1-x)=\frac{3}{2}$ ，那么对所有的 $z_2\in\Delta_2$ ,有 $u_1(x_1,z_2)<u_2(y_1,z_2)$
即可剔除策略3

严格占优可解

$G=(I,S,\pi)$ ,令 $S^D\subset S$ 为非重复剔除严格被占优策略纯策略组合的子集，若该集合为单点集合则称该博弈严格占优可解。

最优反应

纯策略最优反应

定义： $\beta_i(y)=\{h\in S_i:u_i(e_i^h,y_{-i})\ge u_i(e_i^k,y_{-i}),\forall k\in S_i\}$

意思就是：对其他博弈方的每个策略组合 $y\in\Theta$ ,博弈方i均可以找出一个收益最高的纯策略 $s_i\in S,s_i$ 的集合即为博弈方i的纯策略最优反应对应 $\beta:\Theta\rightarrow S_i$

$u_i(x_i,y_{-i})=\Sigma_{k=1}^{m_i}(e_i^k,y_{-i})x_{ik}\le \Sigma_{k=1}^{m_i}(e_i^h,y_{-i})x_{ik}=u_i(e_i^h,y_{-i})$

即：针对某个混合策略 $y\in \Delta$ 博弈方i采取混合策略的收益小于纯策略最优反应带来的收益。

混合策略最优反应

混合策略 $x_i$ 带来的收益最高。将博弈方i的混合策略最优反应对应 $\widetilde{\beta}_i：\Theta\rightarrow\Delta_i$
$\widetilde{\beta}_i(y)=\{x_i\in\Delta_i:u_i(x_i,y_{-i})\ge u_i(z_i,y_{-i}),\forall z_i\in\Delta_i\}\\ =\{x_i\in\Delta_i:x_{ih}=0,\forall h\notin\beta_i(y)\}\\ =\{x_i\in\Delta_i:C(x_i)\subset\beta_i(y)\}$
$\widetilde\beta_i(y)$ 为针对混合策略y的最优反应
请添加图片描述
图中也就是说，会有不同的混合策略对应着相同的最优反应。

组合混合策略最优反应对应 $\beta:\Theta\rightarrow\Theta$ 被定义为 $\widetilde{\beta}(y)=X_{i\in I}\widetilde{\beta}_i(y)$
请添加图片描述
也就是说，混合策略最优反应 $\widetilde\beta(y)$ 是包含各博弈方最优反应笛卡尔积的空间。
注：本文参考《演化博弈论》乔根·W·布威尔