博弈论学习笔记(五)纳什均衡之坏风气与银行挤兑

纳什均衡(NE)
策略组合是一个集合,该集合包括每个参与人的一个已选策略,用S1*,S2*,...,Sm*表示(假设这个博弈一共有m个参与者组成),纳什均衡是满足如下条件的均衡:
对于任意此集合内的参与者i,他所选的策略Si*是其他参与者所选策略S-i*的最佳对策(Best Response),也就是说每个参与者都选择了最佳对策。
案例
 lcr
U0,44,05,3
M4,00,45,3
D3,53,56,6
这里我们用蓝色表示参与者1的最佳策略,红色表示参与者2的最佳策略。
可以看出:
    BR1(l) = M
    BR1(c) = U
    BR1(r) = D
    BR2(U) = l
    BR2(M) = c
    BR2(D) = r
  (D,r)是纳什均衡。

将纳什均衡和优势劣势联系起来
这里我们又重新回到囚徒困境的情况来分析。同样用蓝色表示参与者1的最佳策略,红色表示参与者2的最佳策略。
 αβ
α0,03,-1
β-1,30,0
可以看出:(α,α)是纳什均衡。 -- 因为在任何情况下我们都不回去考虑那些绝对劣势策略(如这里的β)。

然而,弱劣势情况就不像绝对劣势情况那样好处理。
案例二
 αβ
α1,10,0
β1,10,0
这种情况系产生了两个纳什均衡,即(α,α)和(β,β)。
虽然看上去选(β,β)的情况很傻,但是也是有其一定依据。
游戏:全班同学进行一个游戏,每位同学可以选择投资10美元或者期权,如果全班有90%以上的人都选择了投资,那么投资的人会得到50%的利润;不然,投资的人会损失掉投资的钱。
这种情况下有两种纳什均衡:
	全班都投 或者 全班都不投。显然“全班都投”能带来利润而“全班都不投”不能带来利润。
	如果初始全班有93%的人投资了,那么在下一次投资的时候会有更多的人投资,趋向于“全班都投”的纳什均衡。
如果初始全班只有不到50%的人投资了,那么下一次骰子的时候会有更少的人投资,趋向于“全班都不投”的纳什均衡。此时较优的纳什均衡处于帕雷托劣势。
那么这个时候如果有一个人站出来跟大家讲道理,说服大家往投资的方向上走,大家还是很有可能趋向于“全班都投”的。
所以纳什均衡和囚徒困境不同的一点在于:
	纳什均衡是可以通过说服来改变参与者的选择的。
	而囚徒困境是不能通过说服改变参与者的选择的。因为没有一个人会傻到选择绝对劣势策略。
这种情况在上个世纪30年代经常发生在银行挤兑上,坏风气还导致市场泡沫。电影《美丽人生》中就发生过类似银行挤兑的事,但是那家银行没有倒闭,因为Jimmy Stewart站出来指挥大家,只取出生活必须的一小部分钱;最后银行挤兑时间过去之后,大家发现银行没有倒闭,于是又把钱存了进去。人群有一种跟风的想象,就是好的情况出现的时候大家的态度都会趋向于好的情况,坏的情况出现的时候大家的态度都会趋向于坏的情况。

个人总结:
  1. 纳什均衡“不后悔”no regret,即你做出选择之后不会后悔
  2. 纳什均衡可能取决于初始条件与阈值(即超过阈值往好的方向发展,低于阈值往差的方向发展 -- 不稳平衡)
  3. 纳什均衡本身具有强制力,我们最终会做出正确的选择,而不是别人逼迫我们的(区别于囚徒困境,想要化解囚徒困境必须签署合同)
纳什均衡收风气影响的例子:
	微软的垄断导致大量软件与微软绑定
	。。。。。。

转载于:https://www.cnblogs.com/junealan/p/4341556.html

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
非合作博弈论中,纳什均衡是指在博弈中所有人都采取最优策略的状态。而麻雀搜索算法则是一种启发式搜索算法,通过搜索最优解来求解问题。 在使用麻雀搜索算法求解纳什均衡时,需要先定义博弈的规则和策略空间。然后,利用搜索算法不断地尝试不同的策略组合,并评估其对应的收益情况,直到找到所有玩家都无法通过改变策略来获得更多收益的状态,即为纳什均衡。 具体来说,可以采用以下步骤来实现麻雀搜索算法求解纳什均衡: 1. 定义博弈的规则和策略空间,包括所有玩家可选的行动和对应的收益情况。 2. 初始化搜索算法的起始状态,即所有玩家都采用随机的策略。 3. 通过枚举所有玩家可能的行动来生成下一个状态,并评估该状态对应的收益情况。 4. 判断当前状态是否为纳什均衡,如果是,则输出结果并结束搜索算法;否则,继续进行下一轮搜索。 5. 在每一轮搜索中,根据当前的收益情况和预定义的启发式函数来选择最优的策略组合,并将其作为下一轮搜索的起点。 6. 重复步骤3到步骤5,直到找到纳什均衡或搜索算法达到事先设定的最大迭代次数。 需要注意的是,在实际应用中,麻雀搜索算法可能会受到搜索空间过大和局部最优解的影响,因此需要结合其他算法或优化策略来提高求解效率和准确性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值