2021/12/22
博弈的制胜法典
- 最佳的“策略”
- 掌握“情报”
概念
- 零和博弈
- 在博弈结束时,所有博弈的参与者的收益总和为0
- 受益人的收益来自于受损人的损失
- 在博弈结束时,所有博弈的参与者的收益总和为0
- 简单博弈
- 参与者拥有完全情报、决策均为自己选择的最优解的博弈
- 完全情报博弈
- 赛局中所有的“着”完全为“人的着”
- 双方均采取最佳策略的情况下,博弈的结果注定
- 即结果仅出现三种情况,必然和局,先手必败,后手必败。
- 简单博弈是没有随机性的,“确定”的博弈
- 简单博弈典例:井字棋,象棋,围棋
- 非简单博弈典例:猜硬币
- 参与者拥有完全情报、决策均为自己选择的最优解的博弈
- 着
- 博弈中,所有可能的选择中做出的抉择
- 着可能由随机或自己决定(最佳策略)
- 博弈是由一系列的着所构成
- “人的着”
- 局中人完全由自己决定的、根据掌握的情报所做出的策略
- “机会的着”
- 仅与游戏中的“机会”相关的“着”
- 与局中人的想法、信息无任何耦合关系
- 博弈中,所有可能的选择中做出的抉择
- 前备性
- “着”受影响于之前“着”的内容
- 虽然前备性提供了一些“信号”,但前备性并不具有传递性,所以前备性与先现性不一定等价
- “着”受影响于之前“着”的内容
- 先现性
- 赛局中所有“着”的先后顺序,同时它具有传递性
- 例如,赛程是“A/B/C”,了解了A在B前,B在C前,所以得出A在C前
- 赛局中所有“着”的先后顺序,同时它具有传递性
- 偶合
- 多人博弈中,其中两个局中人互相选择对方为“合伙”
- 本质博弈
- 在零和三人博弈中,存在合伙动机的博弈
- 重复博弈
- 相对于单次的静态博弈,重复博弈往往会将相同的赛局不断重复
- 在重复博弈的过程中,将不仅要求局中人考虑自身利益或当局利益,同时要考虑自己的选择对博弈最后阶段的影响以及其他人对自己的合作意愿等等
- 最终影响重复博弈结果的因素,主要是重复博弈所进行的次数以及信息的完整性。
博弈简例
- 说明
- 以下典例中,“人的着”均采取最佳策略
- 猜硬币
- 类型
- 零和二人博弈
- 规则
- 甲猜测乙的硬币正反面
- 博弈结论
- 掌握对方信息者获胜
- 如果对方能够知道你的想法,最佳的方案是引入随机性,让你自己也不知道自己的结果(通过掷硬币的方式决定自己的选择)
- 类似典例
- 猜拳
- 火车上的福尔摩斯(文学作品中的博弈桥段)
- 类型
- 扑克博弈
- 流程
- 甲获得了“机会的着”A(收到发的牌),甲做出“人的着”A1(甲下注),乙接着做出人的着“B1”(乙下注)
- 分析
- 此时A前备于A1,B1前备于A1,但A并不前备于B1,A与B1并无直接传递
- 流程
- 桥牌
- 分析
- 虽然桥牌必须由四人参与,但其规则限死了南北方、东西方玩家为一个利益共同体,所以桥牌实际上为二人零和博弈
- 此时单个局中人的数量为两人
- 前备和先现不等价的典例
- 虽然桥牌必须由四人参与,但其规则限死了南北方、东西方玩家为一个利益共同体,所以桥牌实际上为二人零和博弈
- 分析
- 囚徒困境
- 分析
- 双输的局面主要原因是单次静态博弈
- 同时无法确认对方的合作意图是否真实或了解不到对方的合作意图
- 分析
- 智猪博弈
- 分析
- 小猪的其中一个选择总会在所有的情况中占优
- 分析
笔记
- 对于三人零和博弈
- 其规则对于三个局内人而言是完全公平的
- 但局内人的“人的着”并不对称,会产生事实上的不公平
- 两个局内人由于偶合产生的“合伙”行为,会将第三个局内人孤立于“合伙”之外
- 通常在这种情况下,“合伙”的两个局内人各自收益0.5,孤立的局内人损失1
- 任何一种形式的合伙都能够从对手那里获得收益1,此收益将被均分给所有合伙人
- 需要所有的局内人对等