15. 落后的感应------国际象棋、战略和可信的威胁
通过上节课最后的小游戏尼姆博弈(Nim Game)来承上启下。这个游戏的结论是当两堆石子数目一致时,后行者每次选择与先行者对称的策略(先行者选择A堆的x个,后行者就选择B堆的x个)来取胜。当两堆石子数目不一致时,先行者选择较多的那堆石子将两堆数目变得一致,即先行优势可以在自己进行一轮后将局势转换成后行优势。
这里要介绍策梅洛(Zermelo)定理,假设为完全信息博弈(知道之前的决策)、有限结点、博弈结果有三种可能,那么先行或后行者当一必有一方有必胜/必不败的策略。
有了这个定理,我们就可以知道譬如井字过三关(tic-tac-toe)平局博弈、西洋跳棋、国际象棋等博弈都会有结果。
而策梅洛定理可以采用归纳法证明,归纳的对象是博弈的最大长度N(也可以看成博弈树的高度)。
首先证明对长度为1时的博弈成立,然后假设长度小于等于N的博弈成立,推出博弈为N+1的博弈也成立。
在后一步的推导过程中我们定义了子博弈问题(subGame),例如在长度为N的博弈中第一个节点处一号参与者选择向上或者向下走之后的子树对应一个子博弈问题,其长度为N-1。
我们首先假设所有长度为N或者更小的博弈都有解,我们指出所有长度为N+1的博弈都可看作是一号参与者走了整个博弈的第一步之后的长度为N或者更小的子博弈。每个长度为N或者更小的步数的博弈都有解,那么一号参与者只需要早这里选择一个对他来说更优的子博弈,我们的证明就结束了。
玩游戏