博弈论:帕累托最优与纳什均衡的联系和区别

本文探讨了博弈论中的两个重要概念——帕累托最优和纳什均衡。帕累托最优强调在不损害他人利益的情况下无法进一步改善的状态,而纳什均衡则是非合作博弈中,当每个参与者都无法单方面改变策略以获得更好结果时的稳定状态。以囚徒困境为例,(C,C)是唯一纳什均衡,但并非帕累托最优。在混合策略的零和博弈如“石头剪刀布”中,均匀分布的策略构成纳什均衡。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述
囚徒困境中, ( C , C ) 为纳什均衡,其他为帕累托最优 囚徒困境中,(C,C)为纳什均衡,其他为帕累托最优 囚徒困境中,(C,C)为纳什均衡,其他为帕累托最优

帕累脱最优(特点:不能损害对手的利益)

帕累托改进

  • 如果对某一种方案而言,存在着一种调整策略,使得原方案经过调整后,能让至少一个人受益的同时不让任何人受到损失,那么这种调整策略就称为帕累托改进。

帕累托最优

  • 找不到任何的帕累托改进的余地,我们就说这个方案达到了帕累托最优。这意味着,帕累托最优的局面是所有人都满意的整体有利的方案。在这种情形下,如果某些人还想增加自己的利益,就只能损害别人的利益。所以很明显的是,帕累托最优是一种整体上的评价。
  • CC存在帕累托改进(让系统种的一个人变好但是不影响其他人),所以不是帕累托最优

纳什均衡纳(特点:非合作,动态平衡)

  • 纳什均衡纳什均衡是非合作博弈论中的一个基础概念。
    而非合作博弈是指排除玩家结盟的情形,每个玩家都是独立的。 一般而言,每个玩家的决策都会影响到别人,所以当你改变策略时,别的玩家就会相应变换自己的对策,整个游戏局面就会不断地发生变化。
    而纳什均衡却指出了游戏过程中可能出现的一种特殊状态。在这个局面下,如果其他玩家的策略不变,每一个玩家都没有动机改变自己现在的策略。这个时候所有的玩家就进入了一种平衡态,称为纳什均衡。也就是说,在纳什均衡下,每个人都满意自己当前的策略。

在这里插入图片描述

  • 甲:“
    假如乙不招供,我只要招供,立即可以获得自由,而不招供却要坐牢1年,显然招供比不招供好;
    假如乙招供了,我若不招供,要坐牢10年,我招供了只坐5年牢,显然还是招供的好。可见,无论乙招供与否,我的最佳选择都是招供。”
    乙同理。

纳什均衡存在定理

在混合策略的情况下,有限个玩家与有限个动作的情况下,至少存在一个纳什均衡点。 比如在零和博弈的“石头剪子布”游戏中 [ 1 3 , 1 3 , 1 3 ] 策略为纳什均衡策略 在混合策略的情况下,有限个玩家与有限个动作的情况下,至少存在一个纳什均衡点。\\ 比如在零和博弈的“石头剪子布”游戏中[\frac{1}{3},\frac{1}{3},\frac{1}{3}]策略为纳什均衡策略 在混合策略的情况下,有限个玩家与有限个动作的情况下,至少存在一个纳什均衡点。比如在零和博弈的石头剪子布游戏中[31,31,31]策略为纳什均衡策略

帕累托最优与纳什均衡的数学描述

在这里插入图片描述
在这里插入图片描述

Minimax定理

极小化极大决策函数

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值