【博弈论3——二人博弈的纳什均衡】

最新推荐文章于 2025-03-22 16:35:19 发布

我就是菜鸡1229

最新推荐文章于 2025-03-22 16:35:19 发布

阅读量5.4k

点赞数 33

文章标签：博弈论 MOOC

本文链接：https://blog.csdn.net/qq_45467608/article/details/137201661

版权

1.俾斯麦海之战

在这里插入图片描述

2. 零和博弈的定义

零和博弈（Zero-Sum Game）是一种博弈论的基本概念，指的是在博弈过程中，博弈参与者之间的收益和损失之和总是一个常数，特别是总和为零。即博弈一方的收益必然等于另一方的损失，不存在共赢或多赢的情况。换句话说，在零和博弈中，博弈双方的利益是对立的，博弈的结果是一方得利必定伴随着另一方的损失，整个博弈的总体价值是恒定不变的。
在这里插入图片描述

3. 纯策略纳什均衡

假设零和博弈 $G=\{S_1,S_2;A\}$ ,其中 $S_1=\{A_1,A_2.A_3\}$ , $S_2=\{B_1,B_2.B_3\}$ ,
$A=\begin{bmatrix} 6 & -1 & 0 \\ 3 & 1 & 2 \\ -3 & 0 & -1 \end{bmatrix}$
各局中人应如何选择自己的策略，保证自己在博弈中取得有利的地位。
在这里插入图片描述

在这里插入图片描述

4.博弈论中的最小最大定理

在这里插入图片描述
对于任意一个两个玩家A和B之间的完全信息、零和、有限策略集的博弈，存在一个数V和玩家A的一个策略σ*，使得无论对手B采取何种策略，通过执行σ*，A所能获得的最小收益至少是V。同时，存在玩家B的一个策略τ*，使得当B执行τ*时，即使面对A的最优策略，其给A带来的最大损失也不超过V。

换句话说，A的最小期望得益（即最大损失）等于B的最大期望损失（即最小得益），这个相同的数值就是游戏的值V。A的最优策略是在所有可能的策略中找到那个能够抵御对手任何反击的策略，以确保最坏情况下的最好结果；而B则反过来尝试最大化A的最坏结果，即最小化自己的最大损失。

博弈在纯策略意义下的纳什均衡可以不唯一，博弈的值是唯一的。

5. 混合策略纳什均衡

假设零和博弈 $G=\{S_1,S_2;A\}$ ,
其中 $S_1=\{A_1,A_2,...A_m\}$ ,选择每个策略的概率为 $X=\{x_1,x_2,...,x_m\}$ ;
$S_2=\{B_1,B_2,...,B_n\}$ ,选择每个策略的概率为 $Y=\{y_1,y_2,...,y_n\}$
$A=(a_{ij})_{m\times n}$
在这里插入图片描述
对于给定的博弈G，
局中人1的所有混合策略构成的集合 $S_1^*=\{X\}$
局中人2的所有混合策略构成的集合 $S_2^*=\{Y\}$
期望为 $G^*=\{S_1^*,S_2^*;E\}$ ,为博弈G的混合扩充。