博弈的图论模型——必败态与核

  • http://www.blogbus.com/yjq24-logs/42653430.html


    上次说了胜态和必败态,还记得最后的练习么?桌子上有15个石子,每人每次可以拿去1个或3个石子,拿走最后一个石子的人赢,列出所有的必败态:0,2,4,6,8,10,12,14。说过了状态作为结点可以画一张有向图,下面这张图就是这个游戏所对应的:


    dg1
     
    我只列了不大于6的状态,回顾一下胜态和必败态的性质:

    胜态一定可以通过某种策略走向必败态;而必败态采取任何策略都将走向胜态。


    用图论的话来说, 
    因为必败态只能走向胜态,所以任何两个必败态结点之间不可能存在边; 
    因为胜态总能走到必败态,所以对任何一个非必败态的结点,一定存在一个从它指向必败态结点的边。 

    不妨看看左图中的0,2,4,6,亲自体会一下。 



    定义:有向图中,集合X中任意两点之间无边,称集合X为内固集。
    定义:
    有向图中,任意不在集合X中的点存在一条指向集合X的边,称集合X为外固集。

    定义:有向图中,集合X 既是外固集,又是内固集,称集合X为核。 



    显然,内,外固集的定义正好针对上面的两句话,而核就是包含所有必败态的集合。 



    定理:双人博弈中,约定走最后一步为胜,如果有核存在,则其中一方有不败策略。 

    证明:不妨设A先行动,初始状态不在核中,由于核是外固集,A一定可以采取某种策略把状态走到核中,然后轮到B;由于核是外固集,所以B不管采取什么策略,都将走出核,所以轮到A的时候,A又可以把状态走进核里。总而言之,A可以使B永远面临核内的状态。无路可走的状态不可能在核外,因为核外总能走到核内,A可以保持不败。如果初始状态不在核中,那么利用同样的想法易知B有不败策略。



    以上的定理意义是非凡的,虽然这个定理在证明之前我们其实就已经了解了核与必败态的紧密联系。那么,对一个博弈游戏来说,找出核是核心问题。在此之前,先得考察核得存在性:

    定理:有限个结点的无回路有向图有唯一的核。

    证明:核可以用如下的方式找出:首先找出没有后继结点的点集P[1](最基本的必败态,比如上图中的结点0),然后找到那些指向P[1]的结点集合为N[1](最基本的胜态,比如上图的结点1和结点3);然后,除去P[1]和N[1]中的点并除去和这些点关联的边,继续寻找没有后继结点的点集P[2](更高级的必败态,比如上图中的结点2),依次类推,则最后的核为P=P[1]并P[2]并…并P[n]。

    很容易说明如此找到的核是内固集,也是外固集,满足核的定义,下面说明一下核为什么不是空集:实际上P[1]就不是空集,对一个没有回路的有向图来说,从图上的某一点出发,就无法回到原来到过的点。而图中的点又是有限的,所以最后必将在某个结点终止,故P不是空集。

    针对不同的游戏,找核是一个麻烦事。首先生成图,有向边取决于游戏规则,然后当我们要找某个必败态的时候,是要先找到之前所有的必败态的,而这正是一个数学问题和一个编程问题的关键差别。在立方和分解问题[unsolved]中,我的问题的提法都是针对某一个特定输入的n来看是否存在(x,y)满足立方和或者平方和等于n.实际上,如果提法换成,输出对所有不大于n的数中可以被分解的数,那么这种提法更适合计算机去解决,因为本质上来说,两个问题是不一样的。对于前者我只需要知道有关n的情况就可以了,而对后者,却调动了资源去计算所有不大于n的数的情况。虽然他们看起来很相近,但是从道理上来说应该后者的劳动量要大得多,可悲的事情就在于,有时候你要算出n的情况,就不得不算一些比n小的数的情况,而这个计算的数目通常是随着n增大而增大的;另一个可悲的事情是,程序员往往已经习惯了第二种提问方式。数学家希望找到某些必要条件或者充分条件来确定n能否被分解,同样的道理,我们也希望能直接找到必败态的规律,而不真正依赖于象上述定理那样递归的思想从P[1]开始找起,这样来解决问题。

    但是,必败态的规律是严格依赖于规则的,这一点对找出必败态的规律来说造成了很大的局限性。这个图的模型在以后还会遇到,到时有更好的方法来寻找必败态。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值