电脑象棋循序渐进(六):质的飞跃

  与本文配套的示范程序是“象棋小巫师” 0.5版,程序清单是:    (1) XQWL05.CPP—— C++源程序;    (2) XQWLIGHT.RC——资源描述文件;    (3) RESOURCE.H——资源符号定义文件;    (4) RES目录——图标、图片、声音等资源。     在阅读本章前,建议读者先阅读象棋百科全书网计算机博弈专栏的以下几篇译文:   (1) 基本搜索方法——简介() (David Eppstein)   (2) 基本搜索方法——置换表 (Bruce Moreland)   (3) 其他策略——胜利局面 (Bruce Moreland)   6.1 置换表     没有置换表,就称不上是完整的计算机博弈程序。   象棋小巫师的置换表非常简单,以局面的 Zobrist Key % HASH_SIZE 作为索引值。每个置换表项存储的内容无非就是: A. 深度, B. 标志, C. 分值, D. 最佳走法, E. Zobrist Lock 校验码。置换表的处理函数也很传统——一个 ProbeHash 和一个 RecordHash 就足够了。   先说 RecordHash,即便采用深度优先的替换策略, RecordHash 也非常简单,在判断深度后,将 Hash 表项中的每个值填上就是了。   再看看 ProbeHash 是如何利用置换表信息的:    (1) 检查局面所对应的置换表项,如果 Zobrist Lock 校验码匹配,那么我们就认为命中 (Hit)了;    (2) 是否能直接利用置换表中的结果,取决于两个因素: A. 深度是否达到要求, B. PV节点还需要考虑边界。   第二种情况是最好的 (完全利用 )ProbeHash 返回一个非 -MATE_VALUE 的值,这样就能不对该节点进行展开了。   如果仅仅符合第一种情况,那么该置换表项的信息仍旧是有意义的——它的最佳走法给了我们一定的启发 (部分利用 )。   6.2 杀棋分数调整     象棋小巫师从学会走棋开始,就已经考虑了杀棋分数。不过增加了置换表以后,这个分数要进行调整——置换表中的分值不能是距离根节点的杀棋分值,而是距离当前 (置换表项 )节点的分值。所以当分值接近 INFINITY -INFINITY 时, ProbeHash RecordHash 都要做细微的调整:    (1) 对于 RecordHash:置换表项记录的杀棋步数 = 实际杀棋步数 - 置换表项距离根节点的步数;    (2) 对于 ProbeHash:实际杀棋步数 = 置换表项记录的杀棋步数 + 置换表项距离根节点的步数。   6.3 杀手 (Killer) 走法     把这个术语取名为 Killer真是有些奇怪,但我们还是沿用这个术语。   杀手走法就是兄弟节点中产生 Beta截断的走法。根据国际象棋的经验,杀手走法产生截断的可能性极大,所以我们在中国象棋里吸取了这个经验。很显然,兄弟节点中的走法未必在当前节点下能走,所以在尝试杀手走法以前先要对它进行走法合理性的判断。我们在 0.2版中就写过 LegalMove 这个函数,这里它将大显身手。如果杀手走法确实产生截断了,那么后面耗时更多的 GenerateMove 就可以不用执行了。   如何保存和获取“兄弟节点中产生截断的走法”呢?我们可以把这个问题简单化——距离根节点步数 (nDistance)同样多的节点,彼此都称为“兄弟”节点,换句话说,亲兄弟、堂表兄弟以及关系更疏远的兄弟都称为“兄弟”。   我们可以把距离根节点的步数 (nDistance)作为索引值,构造一个杀手走法表。象棋小巫师的每个杀手走法表项存有两个杀手走法,走法一比走法二优先:存一个走法时,走法二被走法一替换,走法一被新走法替换;取走法时,先取走法一,后取走法二。   6.4 优化走法顺序     利用各种信息渠道 (如置换表、杀手走法、历史表等 )来优化走法顺序的手段称为“启发”。象棋小巫师 0.5以前,我们只用历史表作启发,但从这个版本开始,我们采用了多种启发方式:    (1) 如果置换表中有过该局面的数据,但无法完全利用,那么多数情况下它是浅一层搜索中产生截断的走法,我们可以首先尝试它;    (2) 然后是两个杀手走法 (如果其中某个杀手走法与置换表走法一样,那么可以跳过 );    (3) 然后生成全部走法,按历史表排序,再依次搜索 (可以排除置换表走法和两个杀手走法 )。   这样,我们就可以构造一个状态机,来描述走法顺序的若干阶段:
    我们把状态机写在一个叫 Next 的函数中,那么 Alpha-Beta 的循环体就是:
 
…… // 初始化状态机
while ((mv = Next()) != 0) {
 MakeMove(mv);
 …… // Alpha-Beta递归调用
 UndoMakeMove(mv);
 …… // Alpha-Beta边界判断
}
    在 Next 函数中,我们用了不带 breakswitch ... case结构:
 
switch (nPhase) {
case PHASE_HASH:
 nPhase = PHASE_KILLER_1;
 …… // 如果有置换表走法,就可以返回,再次调用就直接跳到 PHASE_KILLER_1
 // 注意:这里没有break!
case PHASE_KILLER_1:
 nPhase = PHASE_KILLER_2;
 ……
}
    这就是“基于置换表的启发式 Alpha-Beta搜索”,目前顶尖的电脑 (国际 )象棋程序都逃脱不了这种架构,只不过它们在置换表和启发算法上更加优化而已。 

  象棋小巫师示范程序(0.1~0.6)下载:http://www.elephantbase.net/download/xqwlight_win32.7z

  CSDN下载频道:http://d.download.csdn.net/source/407014

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值