斯坦福算法博弈论二十讲 - 第一章 简介和实例

博弈的组件 一个参与者集合;每个参与者都有一个策略集合;每个博弈局势下,每个参与者都有一个收益

无秩序代价(POA) 策略型参与者自组织情况下系统的表现与系统最优表现的比值。

纳什均衡 任何参与者都不能通过单方面变更自己的策略而增加收益

纳什定理 任何一个有限博弈都至少含有一个混合策略纳什均衡

混合策略 参与者在所有策略上的概率分布。例如石头剪刀布,平均随机选择、2:4:4的比例选择,都属于混合策略,至于是不是均衡策略参考【纳什均衡】定义

没看懂 非零和双人博弈的计算难度的相关讨论,看完20章再来补充

练习1.1 为奥运会羽毛球赛给出至少两种建议,从而消除参赛队故意输掉比赛的动机

1、取消小组赛,全程采用单败淘汰赛

2、小组赛仅一队晋级

3、事实上世界羽联后来增加了小组赛后的抽签环节,虽然个人感觉并不能完全杜绝同类情况的发生。

练习1.2 背景:

电影《美丽心灵》中纳什同3个朋友在一家酒吧里喝酒,此时进来了5位漂亮的女士,其中一位比其他4位要漂亮一点。纳什与3个朋友想邀请对方跳舞,这个时候他们有几个策略可以选择:一、按照亚当·斯密的理论,也是常人最理性的方式,会先去邀请最漂亮的那位女士跳舞,如果得不到最漂亮的,再退而求其次,邀请其他人。这是一种相对于个人而言最优的策略,也是一种理性的策略。但是每个人都这样做的话,得到的结果是否会与亚当·斯密所说的一样,是一种最大化的集体利益呢?

纳什否认了这种策略,他分析道:若是每个人追求自己最大化的利益,都去邀请那位最漂亮的女士,结果只能是4个男人互相掐架,结果谁也邀请不到。等他们退而求其次再去找其他女士的时候,另外4位女士会觉得自己是别人的第二选择,是别人的替代品,因此拒绝他们的邀请,这样一来,4位男士最终将一无所获。

纳什找出了这其中的“纳什均衡”,提出了自己的策略:每个人都不去邀请那位最漂亮的女士,而是邀请另外4位女士,这样每个人都可以得到一个舞伴,彼此之间又不会起冲突。

分析:同前述定义,在已知其他人的策略(不选择最漂亮的女士)的前提下,可通过改变策略选择最漂亮的女士而获得更多的收益,所以不处于均衡状态。

练习1.3 证明:在石头-剪刀-布博弈中,存在唯一的(混合策略)纳什均衡。

存在性:随机均匀地策略,即[\frac{1}{3},\frac{1}{3},\frac{1}{3}],是一个纳什均衡,满足任何参与者都不能通过单方面变更自己的策略而增加收益,收益期望永远为0

唯一性:一个不均匀的策略,假设为[a, b, c],且a > b(出石头的概率大于出剪刀的),则总可以选择[0,0,1](永远出布)获得大于0的期望

问题1.1 尽量不批评社会问题

问题1.2 示例虽然比较极端,但我向给出结论就够了:纳什均衡并不一定是社会最优化

  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

RivaJ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值