博弈论自学（三）

CP3?

已于 2024-03-12 17:20:11 修改

阅读量964

点赞数 30

文章标签：笔记

于 2024-03-12 17:19:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jxjjxjx/article/details/136627387

版权

本文介绍了博弈论中的策略概念，包括混合策略和随机策略的定义，以及在零和博弈中的应用。重点讨论了最大最小策略，即在最不利情况下寻求最优决策的过程。文章还提及了双人有限策略零和博弈的简化形式和矩阵博弈的特性。

摘要由CSDN通过智能技术生成

一、策略
策略：是参与者在博弈开始之前制定的一个完备行动计划，它明确了在参与者可能遇到的每一种情况下对可行行动的选择。
混合策略（随机策略）：参与者以一定概率分布从几种纯策略中随机选择
例子：下表格可以看出女生和男生在同一地方效用就低，不在同一地方效用就高
单相思（只是觉得这个例子有意思分享下）

		男生
		图书馆	游泳池
女生	图书馆	-1，1	2，-1
女生	游泳池	2，-1	-1，1

补充说明：① 在混合策略中，被赋以正概率的纯策略构成一个集合，称为该混合策略的“支撑”；
② 一个给定的纯策略可能会严格劣于一个混合策略，即使这个纯策略并不严格劣于其他纯策略。
例子：如下图，乙对于任何策略都没有偏好，C策略既不劣于A也不劣于B。当选择D，C优于B，当选择E，C优于A，所以从纯策略看C策略既不劣于A也不劣于B，但是将A,B组合，用掷硬币的方式选择A或者B，那么选择A,B混合策略的不论D还是E都是 2/3，显然优于C

		乙
		D	E
甲	A	3，-	0，-
	B	0，-	3，-
	C	1，-	1，-

③ 一个给定的纯策略可以是针对对手的一个混合策略的最优反应，即使这一纯策略不是针对对手的任何一个纯策略的最优反应。
例子：将上述例子中的C对应的D和E都是(2,-)，乙通过抛硬币的方式选择D还是E，②中的图就变成下图，这样就满足说明③

		乙
		(D,E)
甲	A	3/2，-
	B	0，-
	C	2，-

④ 给定其他参与者的策略，参与者的一个混合策略要成为其最优反应，该混合策略的支撑中的每一个纯策略（即概率大于0的纯策略）也必须是其最优反应。

二、双人零和博弈
零和博弈：在任何一个状态下，各方的所得之和相加为零（通俗的说就是其他参与者的所得就是我的所失），零和博弈属于严格竞争博弈。
例子：两人打牌，A赢10块，B输10块，A和B的总和为0，就是零和博弈
双人有限策略零和博弈：可以从双变量矩阵中省略列参与者的收益（直接取反就行，所以可以省略），又称为矩阵博弈。
1.仅考虑纯策略的情况：如果参与者i事先宣布他会采取策略 $s_{i}$ ，他能获得的最低收益就称为他对于该策略的安全水平；能够给参与者i带来最高安全水平的策略称为他的安全策略（最大最小策略），相应的最高安全水平称为参与者在该博弈中的安全水平（最大最小值）
以A表示参与者i的收益矩阵[ $a_{ij}$ ]，参与者的目标是： $\max_{i\epsilon s_{1}}\min_{j\epsilon s_{2}}a_{ij}$ ，相应的，参与者的策略称为最大最小策略。
个人理解：最大最小考虑的是极端情况，参与者认为对方肯定会选择让自己亏损最大的决策。这时我们关心的就是谁是先决策谁是后决策，若先决策那么会考虑当自己决策完对方肯定会选择让自己亏损最大的决策，那么就要在对方认为自己最小的所有决策当中选择最好的，即：矮个子里拔将军；同样的若后决策，在最大化自己决策的情况下让对方的收益最小，也就是最小最大策略， $\min_{j\epsilon s_{2}}\max_{i\epsilon s_{1}}a_{ij}$ 即：尖子班里挑最差的。
个人感觉最大最小策略是博弈的一种保守策略，一切从最坏的角度考虑收益。
证明： $\max_{i\epsilon s_{1}}\min_{j\epsilon s_{2}}a_{ij}$ $\leq$ $\min_{j\epsilon s_{2}}\max_{i\epsilon s_{1}}a_{ij}$ （瘦死的骆驼比马大）
首先，对于任意的 $s_{1}$ 和 $s_{2}$ 有： $a_{ij}\leq \max_{s_{1}} a_{ij}$
对左右取j的最小值有： $min_{j\epsilon s_{2}}a_{ij}$ $\leq$ $\min_{j\epsilon s_{2}}\max_{i\epsilon s_{1}}a_{ij}$
再左右取i的最大值有： $\max_{i\epsilon s_{1}}\min_{j\epsilon s_{2}}a_{ij}$ $\leq$ $\min_{j\epsilon s_{2}}\max_{i\epsilon s_{1}}a_{ij}$
最小最大定理：对于每个具有有限数量纯策略的双人零和博弈，都存在一个数，参与者1存在一个(混合)策略能保证他的总收益至少为v，参与者2存在一个(混合)策略能保证参与者1的收益至多为v。
对于矩阵博弈，一定存在策略组合(x,y)满足 $\max_{x\epsilon s_{1}} xA\dot{y} = \min_{x\epsilon s_{2}} \dot{x}Ay$ ，而且策略组合（ $\dot{a},\dot{b}$ ）是一个混合策略均衡。（证明略~）

关注

30
点赞
踩
24

收藏

觉得还不错? 一键收藏
1
评论
博弈论自学（三）

（只是觉得这个例子有意思分享下）
复制链接

扫一扫

CP3? CSDN认证博客专家 CSDN认证企业博客

码龄4年

13: 原创

132万+: 周排名

14万+: 总排名

1万+: 访问

: 等级

241: 积分

97: 粉丝

120: 获赞

3: 评论

146: 收藏

私信

关注

热门文章

最新评论

博弈论自学（六）
CSDN-Ada助手: 恭喜您在博弈论自学的路上坚持不懈，第12篇博客写得非常精彩！希望您能继续保持热情，坚持学习和分享，或许可以考虑结合实际案例进行分析，让读者更好地理解博弈论的应用。期待您的下一篇作品，加油！
博弈论自学（五）
CSDN-Ada助手: 恭喜您第11篇博客的发布！学习博弈论确实需要耐心和勤奋，您的自学之路令人钦佩。接下来，或许可以考虑分享一些实践经验或者案例分析，让读者更直观地理解博弈论的应用。希望您能够继续保持创作的热情，期待您更多精彩的文章！祝您越来越进步！
博弈论自学（三）
CSDN-Ada助手: 恭喜您继续撰写关于博弈论的博客！不断学习和分享知识是非常值得赞扬的。接下来，我建议您可以尝试深入探讨一些具体的博弈论案例，或者结合实际生活中的情境来解释博弈论的应用。期待您的下一篇作品！愿您在学习的道路上不断进步，谢谢您的分享！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。