Yale开放课程博弈论15

15. 落后的感应------国际象棋、战略和可信的威胁

 

通过上节课最后的小游戏尼姆博弈(Nim Game)来承上启下。这个游戏的结论是当两堆石子数目一致时,后行者每次选择与先行者对称的策略(先行者选择A堆的x个,后行者就选择B堆的x个)来取胜。当两堆石子数目不一致时,先行者选择较多的那堆石子将两堆数目变得一致,即先行优势可以在自己进行一轮后将局势转换成后行优势。

 

这里要介绍策梅洛(Zermelo)定理,假设为完全信息博弈(知道之前的决策)、有限结点、博弈结果有三种可能,那么先行或后行者当一必有一方有必胜/必不败的策略。

 

有了这个定理,我们就可以知道譬如井字过三关(tic-tac-toe)平局博弈、西洋跳棋、国际象棋等博弈都会有结果。

 

而策梅洛定理可以采用归纳法证明,归纳的对象是博弈的最大长度N(也可以看成博弈树的高度)。

 

首先证明对长度为1时的博弈成立,然后假设长度小于等于N的博弈成立,推出博弈为N+1的博弈也成立。

在后一步的推导过程中我们定义了子博弈问题(subGame),例如在长度为N的博弈中第一个节点处一号参与者选择向上或者向下走之后的子树对应一个子博弈问题,其长度为N-1。

我们首先假设所有长度为N或者更小的博弈都有解,我们指出所有长度为N+1的博弈都可看作是一号参与者走了整个博弈的第一步之后的长度为N或者更小的子博弈。每个长度为N或者更小的步数的博弈都有解,那么一号参与者只需要早这里选择一个对他来说更优的子博弈,我们的证明就结束了。

 

玩游戏

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值