矩阵博弈及其纳什均衡

最新推荐文章于 2025-02-10 14:46:03 发布

ccaicaic

最新推荐文章于 2025-02-10 14:46:03 发布

阅读量8.2k

点赞数 4

分类专栏：博弈论文章标签：其他

本文链接：https://blog.csdn.net/m0_49673695/article/details/124341865

版权

博弈论专栏收录该内容

9 篇文章

订阅专栏

本文详细介绍了矩阵博弈的概念，它是二人有限零和博弈的一种，具有重要理论研究价值。在矩阵博弈中，纳什均衡是关键，通过最大最小和最小最大原则可以找到纯策略的纳什均衡解。例如，当玩家一采用最大最小策略，玩家二采用最小最大策略时，双方的决策将形成纳什均衡。此外，还讨论了矩阵博弈的鞍点性质和混合策略，证明了矩阵博弈在纯策略下存在纳什均衡的充要条件。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在众多博弈模型中，占有重要地位的是二人有限零个对策，又称为矩阵博弈，这对策是目前为止在理论研究和求解方法方面都比较完善的一个博弈。

矩阵博弈

矩阵博弈就是二人有限零和博弈，或有限二人零和博弈；
在众多博弈模型中占有重要地位，是到目前为止，在理论研究和求解方法方面都比较完整的一类博弈。

数学定义：
假设玩家一有m个策略，玩家二有n个策略，那么构建一个m*n的矩阵，对应值为玩家一的收益。

又因为是零和博弈，所以玩家二的收益矩阵就是负的玩家一的收益矩阵。

矩阵博弈通常记为：
$G={S_1,S_2,A}$

纯策略矩阵博弈的纳什均衡解

saddle points鞍点：
同时满足某一行的最小值，某一列的最大值
就是纯策略的纳什均衡

为什么要这样：
零和博弈，参与者2的pay与参与者1的相反，所以固定一行，参与者1可以推导参与者2会选择哪个；
也就是已经知道对方贪心会选择最利于自己的那个，那么自己的一个有效的做法是使得损失最小

两个人都这样，然后交点就是一个纳什均衡

示例

最大最小、最小最大原则
在这里插入图片描述
如图，玩家一的收益矩阵。
最小最大原则：
当玩家一选 $\alpha_1$ 时，理性玩家二会选择 $\beta_3$ ，则玩家一的收益为-9，往下同理，略，所以玩家一会在这里边挑一个最大的也就是3.

最大最小原则：
当玩家二选择 $\beta_1$ 时，玩家一会选择 $\alpha_3$ ，收益为7，往后同理，那么对于玩家二来说，会选择让玩家一收益最小的策略，也就是使玩家一收益为3。
综上，形成纳什均衡 $(\alpha_2,\beta_2)$

用公式简洁表示：
$max_imin_ja_{ij}=min_jmax_ia_{ij}=a_{22}=3$
可以看出， $a_{22}$ 是矩阵A所在行的最小元素也是所在列的最大元素。

所以，一个定理：矩阵博弈在纯策略定义下有纳什均衡的充要条件是：存在一个策略组合，对应的那个玩家一的收益是所在行的最小元素也是所在列的最大元素。即是鞍点。

性质

在这里插入图片描述
1.无差别性
2.可交换性
如图示例子，总共有四个五，四个纳什均衡（即纳什均衡解不唯一）。

混合策略矩阵博弈纳什均衡

混合策略之前的文章讲过了，这里省略。
在这里插入图片描述
假如玩家一以概率p选择第一行，1-p选择第二行，
如果想要使得第二个人看不出第一个人会用什么策略，也就是使得：
$a p + d (1 - p) = b p + c (1 - p)$
解得： $p=\frac{c-d}{(a-b)+(c-d)}$
当p取该值时，玩家一的期望收益：
$v=ap+d(1-p)=\frac{ac-bd}{a-b+c-d}$

随机博弈

本文部分图片来源