博弈论：帕累托最优与纳什均衡的联系和区别

FakeOccupational

已于 2025-06-05 22:27:05 修改

阅读量1w

点赞数 2

分类专栏：其他文章标签：博弈论

于 2021-08-25 10:45:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ResumeProject/article/details/119830558

版权

其他专栏收录该内容

170 篇文章

订阅专栏

本文探讨了博弈论中的两个重要概念——帕累托最优和纳什均衡。帕累托最优强调在不损害他人利益的情况下无法进一步改善的状态，而纳什均衡则是非合作博弈中，当每个参与者都无法单方面改变策略以获得更好结果时的稳定状态。以囚徒困境为例，(C,C)是唯一纳什均衡，但并非帕累托最优。在混合策略的零和博弈如“石头剪刀布”中，均匀分布的策略构成纳什均衡。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述
$囚徒困境中， (C, C) 为纳什均衡，其他为帕累托最优$

帕累脱最优（特点：不能损害对手的利益）

帕累托改进

如果对某一种方案而言，存在着一种调整策略，使得原方案经过调整后，能让至少一个人受益的同时不让任何人受到损失，那么这种调整策略就称为帕累托改进。

帕累托最优

找不到任何的帕累托改进的余地，我们就说这个方案达到了帕累托最优。这意味着，帕累托最优的局面是所有人都满意的整体有利的方案。在这种情形下，如果某些人还想增加自己的利益，就只能损害别人的利益。所以很明显的是，帕累托最优是一种整体上的评价。
CC存在帕累托改进（让系统种的一个人变好但是不影响其他人），所以不是帕累托最优

纳什均衡纳（特点：非合作，动态平衡）

纳什均衡纳什均衡是非合作博弈论中的一个基础概念。
而非合作博弈是指排除玩家结盟的情形，每个玩家都是独立的。一般而言，每个玩家的决策都会影响到别人，所以当你改变策略时，别的玩家就会相应变换自己的对策，整个游戏局面就会不断地发生变化。
而纳什均衡却指出了游戏过程中可能出现的一种特殊状态。在这个局面下，如果其他玩家的策略不变，每一个玩家都没有动机改变自己现在的策略。这个时候所有的玩家就进入了一种平衡态，称为纳什均衡。也就是说，在纳什均衡下，每个人都满意自己当前的策略。

在这里插入图片描述

甲：“
假如乙不招供，我只要招供，立即可以获得自由，而不招供却要坐牢1年，显然招供好；
假如乙招供了，我若不招供，要坐牢10年，我招供了只坐5年牢，显然还是招供的好。”
可见，无论乙招供与否，我的最佳选择都是招供。乙同理。

纳什均衡存在定理

$在混合策略的情况下，有限个玩家与有限个动作的情况下，至少存在一个纳什均衡点。\\ 比如在零和博弈的“石头剪子布”游戏中[\frac{1}{3},\frac{1}{3},\frac{1}{3}]策略为纳什均衡策略$

帕累托最优与纳什均衡的数学描述

在这里插入图片描述

Minimax定理

极小化极大决策函数

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。