读点《博弈论》(一)

读点《博弈论》(一)

Marshal Zheng
2019-06

文章目录

背景

最近中美贸易摩擦引发各方面问题,不乏博弈论的影子。与此同时,在复习网络设计课程内容的时候,总是会想到其中的某些设计与《博弈论》中提到的诸多内容相契合,例如CSMA系列方案,争与不争,这是个问题。

能够想起来《博弈论》中相关的原理,但是不是记得特别清楚,而且忘了比较专业的名字是什么了,很是烦恼,那就重读一遍,并做好笔记。

正文
序言
  • 零和游戏:游戏者有输有赢,但是整个游戏的总成绩永远为0,整个博弈的过程就是一个零和博弈——一个人的所得永远等于另一个人所失。

  • 博弈是一种策略的相互依存状况:你的选择,即策略将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。

  • 不过,更常见的是,既有共同利益,又有利益冲突,从而可能出现导致共同受益或者共同受害的策略组合。

  • 如果你离开双方相互适应的简单原则,那么你的聪明是不会有好结果的。

  • 任何游戏都有其规则。规则既不能太死,也不能太宽松。好的规则才给游戏者选择的空间,才好玩。

  • 古老的政府形态都要确立一个领导人,他拥有绝对权威,主导重大决策。在危急的情况下,一个受认可的领导者不论多么无能,都比完全没有领导人要来得好,所有军队都明白这个道理。

  • 理性的决策是重要的,但是有时候,没有选择的决策和运气也是很重要的。

  • 走在鲁莽和优柔寡断之间的空间。

chapter 1
  • 囚徒困境
    • 河蚌和鹬鸟的故事,相互之间谁都不放嘴,最终渔夫获利
    • 甲乙两个人被抓住,主动坦白和顽抗到底有不同的后果,也会对对方造成影响,他们都选择对自己最有利的那个选择。而非全局最优。
    • 个体对自身利益的追求会损害整体的利益。
    • 启示1:在“囚徒困境”中最好的策略直接取决于对方采用的策略。
    • 启示2:在“囚徒困境”这样的环境中,背叛是最好的选择,虽然整体结果不甚理想。
  • 从另一个角度看,如果他们合作(不招供),整体会得到最好的结果
    • 经济角度,几个大企业联手形成对行业的垄断,谋求最大利润,他们结成的联盟成为“卡特尔”
    • 但是,“卡特尔”由于组成成员的自由独立性,其本身就是不稳定的
  • 优势——劣势——均衡
    • 双方的策略往往都是有迹可循的,并形成某种定式,即均衡
    • 一种博弈是两者同时进行的,双方同时行动,只能根据先前的动作和当前的形势(有利或者不利)做出反应,例如《时代周刊》和《新闻周刊》同时刊发文章博取受众的眼球。
    • 下棋是相继进行的,一前一后的,每个参与者必须向前展望,估计对手的意图,从而倒后推理,决定自己的这一轮应该怎么走**(前向计算,后向传播)**
    • 同时策略的最优:站在对方的角度看,就可以确定其当前选择的对手最优策略,从而根据这个策略分析自己当前的最优策略。
    • 也就是说,在这个博弈里,当对手有优势策略的时候,双方都有一个优势策略。
  • 马太效应:凡是少的,连他仅有的也夺过来;凡是多的,就加给他,让他更多。
    • 追求最佳,避免最差
    • 不是所有博弈都有一个优势策略
    • 实际上,优势与其说是一种规律,不如说是一种例外。虽然一个优势策略可以大大简化行动规则,但却并不适用于大多数生活中的博弈。
    • 剔除所有的劣势策略,选择较优的那一个,降低博弈的复杂度
  • 纳什均衡
    • 一个策略组合中,所有参与者面临这样的一种情况,当其他人不改变策略的时候,他此时的策略是最好的,也就是说,此时如果他改变策略,那么他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
    • 在囚徒困境中的纳什均衡点是:两个囚犯均选择招供,这是唯一稳定结果
    • 有些博弈纳什均衡点不止一个
    • 为什么参与者要达到这样一个结局呢?
      • 避免循环推理,没用的
      • 零和博弈中,应充分考虑对手的最佳对策
      • 注重实效检验
    • 当然,均衡并不一定是最有利的结果
    • 不一定存在纯策略纳什均衡点(唯一的),但至少存在一个混合策略纳什均衡点,即策略空间上的概率分布,不是唯一的策略
    • 策略空间上的概率分布:可以用概率论的内容来分析。
      • 例如警察和小偷的故事:一个小偷去偷银行(2万)和酒馆(1万),一个警察应该如何选择去坚守哪一个地方。这里最好的做法是抽签决定,小偷的行为是随机的,银行的价值是酒馆两倍,所以用两个签,酒馆一个,这样警察有2/3的概率就银行,1/3的概率去酒馆。同样小偷也是用抽签的方法决定自己去哪里行窃,用两个签去酒馆,1个签去银行。
  • 解决问题的公式
    • 找出问题发生的原因
    • 分辨情报的价值
    • 彻底推行解决方案
    • 观察事情是否进行的顺利
  • 斗鸡博弈
    • 两只公鸡相遇,每只鸡有两个选择:退下来或者进攻。如果一方进攻,一方退下来,则进攻者胜利,另一方丢了面子,如果都前进,那么两败俱伤。
    • 这个博弈有两个或者两个以上的纳什均衡点,无法预测斗鸡博弈的结果。
    • 古巴导弹危机的例子
chapter 2
  • 同时行动博弈
    • 行动法则:寻找运用优势策略;避免劣势策略,同时假定对手也这样做;寻找运用均衡。
  • 一报还一报的伟大胜利
    • 合作、背叛的计算机竞赛。根据比赛规则,合作和背叛都会得到不同的分数,当一方合作一方背叛时,背叛者得到5分,合作者得到0分,如果都背叛得1分,如果都合作得3分。如何设计算法,使得比赛官方给出的各种情况的整体得分最高。
    • 一报还一报的策略比其他各种复杂算法都有更好的结果
    • 一报还一报:第一步合作,对方每次一背叛之后就背叛一次,如果对方合作,那么就合作。
    • 每个正常人都会知道面对这样的对手占便宜只能是一次获利,之后都两败俱伤,而与他们合作才是最佳的选择。而一报还一报的人也给了对手自己的明确行为准则。
    • 启示:不是靠打击对方(一直背叛),而是靠从对方引出使得双方都获利的行为
    • 启示:你不必每次都赢
    • 启示:
      • 不要嫉妒
      • 不要首先背叛,不善良的规则可能付出代价
      • 对合作与背叛都要给以反馈
      • 不要耍小聪明,事实证明,参赛者设计的各种精巧复杂的算法,都不如这样的简单策略结果要好
  • 笼中猪博弈
    • 笼子两头猪,一只大,一只小,按一下进食按钮有10份食物,但是按按钮要消耗2份,如果小猪按,那么大猪吃9,小猪吃1,如果大猪按,大猪吃6,小猪吃4,如果一起,那么大猪吃7,小猪吃3
    • 通过分析比较,等待(不去按)是小猪最优的策略,而大猪只剩下两个选择:等待-什么也得不到;去按-净得到4份。所以,此时大猪的劣势策略是等待,删掉。
    • 最终的情况是:大猪去按按钮,小猪坐享其成
    • 其实:资源占有者必须承担更多的义务
  • 持续性和未来的影响
    • 如果未来相对于现在是足够重要的话,双方的合作是稳定的
    • 如果接触不是重复的,合作就非常空难,此时背叛就可能是最好的选择
    • 增大未来的影响:
      • 例如婚礼
      • 接触更加频繁,比如行业内部大公司之间接触的默契
  • 改变收益值
    • 出租政府奖章和出售政府奖章的收益完全不同
  • 利他主义:教育人们相互关心
  • 教育人们要反馈
    • 一报还一报可能会造成无休止的仇恨
    • 也可以是一报还9/10报,教育人们多一点宽容(随机退避)
  • 战争决策
    • 人海战术???现代战场不可行
    • 兰彻斯特定律:分散敌军,各个击破
      • 精巧的15支军队和地方17支军队的对决
        • 军力为人数的平方(假设)
        • 225-289显然失败
        • 不过若是地方分散:225-144,之后81-25,便得到了胜利
    • 合则两利,分则两害
    • 守而不足,攻则有余
      • 有一定的兵力,一定要用来进攻,而不是防守
      • 消极别动防御很少能坚持到最后
    • 例子:敌军三个师,守两路(通往地方大本营),我方两个师,攻打敌方大本营;规则:每次相遇,由于敌方是守方,所以我方必须人数多于敌方才能获胜,否则失败。
      • 策略分析:
        • 敌军:3A,0B; 2A1B; 1A2B; 0A3B
        • 我军:2A; 2B; 1A1B
      • 事实证明,我军的最优策略是集中两个师的兵力进攻其中一条路,在敌众我寡的情况下仍然能够拿到50%的成功率。
      • 而如果双方军队数量相同,我方则可以拿到2/3的成功率
    • 胜利方法
      • 了解对手
      • 保证自己的信息不被对方了解
  • 表明立场
    • 人人都追求胜利,但不是所有的胜利都是值得的,可能有的需要付出沉重的代价
    • 成本就是为了得到某些东西必须放弃的东西
chapter 3
  • 认识自己,选择自己擅长的
  • 如果不断修正想法、物体或者过程,就会逐渐把任务缩小为核心的部分
  • 骑虎难下的博弈
    • 最好的行动是:及早推出
    • 千万不要抱有侥幸,越陷越深
  • 焦土政策
    • 显示自己绝不妥协的立场
    • 增大对手的成本
    • 破釜沉舟
  • 威胁和许诺
    • 威胁和许诺必须让对方看到和明确
    • 威胁和许诺要适度,而且自己的代价应该是越小越好
  • 不能取胜,就该谋和
    • 避免时间、精力等资源的浪费
    • 借妥协的时间,扭转劣势——战术
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值