【读书笔记】《博弈论》

本文介绍了博弈论中的基本概念,包括零和博弈、简单博弈和非简单博弈,以及它们的典型例子。重点讨论了情报、策略和决策在博弈中的重要性,并通过猜硬币、扑克博弈等实例阐述了如何在不确定性和信息不对称中制定最佳策略。此外,还分析了重复博弈和合作博弈对决策的影响,揭示了博弈中的动态和复杂性。
摘要由CSDN通过智能技术生成

2021/12/22

博弈的制胜法典

  • 最佳的“策略”
  • 掌握“情报”

概念

  • 零和博弈
    • 在博弈结束时,所有博弈的参与者的收益总和为0
      • 受益人的收益来自于受损人的损失
  • 简单博弈
    • 参与者拥有完全情报、决策均为自己选择的最优解的博弈
      • 完全情报博弈
      • 赛局中所有的“着”完全为“人的着”
    • 双方均采取最佳策略的情况下,博弈的结果注定
      • 即结果仅出现三种情况,必然和局,先手必败,后手必败。
      • 简单博弈是没有随机性的,“确定”的博弈
        • 简单博弈典例:井字棋,象棋,围棋
        • 非简单博弈典例:猜硬币
    • 博弈中,所有可能的选择中做出的抉择
      • 着可能由随机或自己决定(最佳策略)
      • 博弈是由一系列的着所构成
    • “人的着”
      • 局中人完全由自己决定的、根据掌握的情报所做出的策略
    • “机会的着”
      • 仅与游戏中的“机会”相关的“着”
      • 与局中人的想法、信息无任何耦合关系
  • 前备性
    • “着”受影响于之前“着”的内容
      • 虽然前备性提供了一些“信号”,但前备性并不具有传递性,所以前备性与先现性不一定等价
  • 先现性
    • 赛局中所有“着”的先后顺序,同时它具有传递性
      • 例如,赛程是“A/B/C”,了解了A在B前,B在C前,所以得出A在C前
  • 偶合
    • 多人博弈中,其中两个局中人互相选择对方为“合伙”
  • 本质博弈
    • 在零和三人博弈中,存在合伙动机的博弈
  • 重复博弈
    • 相对于单次的静态博弈,重复博弈往往会将相同的赛局不断重复
    • 在重复博弈的过程中,将不仅要求局中人考虑自身利益或当局利益,同时要考虑自己的选择对博弈最后阶段的影响以及其他人对自己的合作意愿等等
    • 最终影响重复博弈结果的因素,主要是重复博弈所进行的次数以及信息的完整性。

博弈简例

  • 说明
    • 以下典例中,“人的着”均采取最佳策略
  • 猜硬币
    • 类型
      • 零和二人博弈
    • 规则
      • 甲猜测乙的硬币正反面
    • 博弈结论
      • 掌握对方信息者获胜
      • 如果对方能够知道你的想法,最佳的方案是引入随机性,让你自己也不知道自己的结果(通过掷硬币的方式决定自己的选择)
    • 类似典例
      • 猜拳
      • 火车上的福尔摩斯(文学作品中的博弈桥段)
  • 扑克博弈
    • 流程
      • 甲获得了“机会的着”A(收到发的牌),甲做出“人的着”A1(甲下注),乙接着做出人的着“B1”(乙下注)
    • 分析
      • 此时A前备于A1,B1前备于A1,但A并不前备于B1,A与B1并无直接传递
  • 桥牌
    • 分析
      • 虽然桥牌必须由四人参与,但其规则限死了南北方、东西方玩家为一个利益共同体,所以桥牌实际上为二人零和博弈
        • 此时单个局中人的数量为两人
        • 前备和先现不等价的典例
  • 囚徒困境
    • 分析
      • 双输的局面主要原因是单次静态博弈
      • 同时无法确认对方的合作意图是否真实或了解不到对方的合作意图
  • 智猪博弈
    • 分析
      • 小猪的其中一个选择总会在所有的情况中占优

笔记

  • 对于三人零和博弈
    • 其规则对于三个局内人而言是完全公平的
    • 但局内人的“人的着”并不对称,会产生事实上的不公平
      • 两个局内人由于偶合产生的“合伙”行为,会将第三个局内人孤立于“合伙”之外
      • 通常在这种情况下,“合伙”的两个局内人各自收益0.5,孤立的局内人损失1
  • 任何一种形式的合伙都能够从对手那里获得收益1,此收益将被均分给所有合伙人
    • 需要所有的局内人对等

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值