第九章 矩阵博弈

1. 知识储备

1.1 零和博弈(zero-sum game)

  • 零和博弈(zero-sum game),又称零和游戏,与非零和博弈相对,是博弈论的一个概念,属非合作博弈。
  • 它是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作的可能。

1.2 矩阵博弈

  • 两人零和博弈描述了两人严格竞争情形。矩阵博弈(matrix games)是伴随有限策略集的两人零和博弈。
  • 最小最大值定理(minimax theorem), 表明每个矩阵博弈都有混合策略纳什均衡。

在这里插入图片描述

2. 正文【矩阵博弈】

在本章中,我们仅讨论有限策略集的两人零和博弈。假设 S 1 = { s 11 , s 12 , … , s 1 m } , S 2 = { s 21 , s 22 , ⋅ ⋅ ⋅ , s 2 n } S_1=\{s_{11},s_{12}, …, s_{1m}\} ,S_2=\{s_{21}, s_{22},···,s_{2n}\} S1={s11,s12,,s1m}S2={s21,s22,s2n}

在不至于混淆的情形下,我们从现在起使用符号 S 1 = 1 , 2 , ⋅ ⋅ ⋅ , m , S 2 = 1 , 2 , ⋅ ⋅ ⋅ , n S_1= {1, 2, ···,m}, S_2={1, 2, ···, n} S1=1,2,,m,S2=1,2,,n [注意,不要将这里的n与本书其他地方的n(代表参与博弈的人数)相混淆]。

由于一个参与人的收益正好是另外一人收益的相反数,这些博弈可用含有 m 行和 n 列的矩阵A表示,其中 a i j = u 1 ( i , j ) , ∀ i ∈ S 1 , ∀ j ∈ S 2 a_{ij}=u_1 (i, j), \forall i \in S_1,\forall j \in S_2 aij=u1(i,j),iS1,jS2. 这个数是当参与人1 (行参与人)选择策略 i i i 且参与人2 (列参与人)选择策略 j j j 时的收益,此时参与人 2的收益为 − a i j -a_{ij} aij;。因此,这样的博弈也称为矩阵博弈。

2.1 矩阵博弈案例

2.1.1 硬币问题

硬币问题,参与人各抛一枚硬币,然后进行配对,配对成功(同为正或同为反)参与人 1 得一块钱,反之,参与人 2 得一块钱
在这里插入图片描述

2.1.2 石头剪刀布问题

在这里插入图片描述

2.1.3 产品预测问题

在这里插入图片描述

2.1.4 零和博弈的问题

收益之和为常数的一个博弈

  • 零和博弈的一个直接推广就是收益之和为 常数的博弈: < 1 , 2 , S i , S 2 , u 1 , u 2 > <{ 1, 2} ,S_i , S_2 , u_1 , u_2> <1,2SiS2u1u2> 使得 u 1 ( s 1 , s 2 ) + u 2 ( s 1 , s 2 ) = C u_1 (s_1, s_2 )+u_2(s_1, s_2 )=C u1(s1,s2)+u2(s1,s2)=C, 其中 C 是一个已知常数。
  • 给定任何一个收益之和为常数的博弈,我们都可以通过简单变换(比如,将每个参与人的每个收益减去该常数),把它变为一个零和博弈, 从而将其作为零和博弈进行分析。

2.2 矩阵博弈中的纯策略

2.2.1 介绍

在这里插入图片描述
类似地,当列参与入选择纯策略 j j j 时,他保证他的收益等于
在这里插入图片描述
也就是说,列参与人保证自己的损失不大与
在这里插入图片描述
于是,列参与人的最优策略是使得这个损失最小:
在这里插入图片描述
这称为最小最大化(mirunaximization)列参与人的这种策略称为他的安全策略(secu­rity strategy)。

2.2.2 相关定义


在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.2.3 求解纯策略的值

在这里插入图片描述
在这里插入图片描述

参考

《博弈论与机制设计》中国人民大学出版社,经济科学译丛

  • 6
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值