c语言五子棋评估函数,局面评估函数——简介

本文介绍了五子棋评估函数的设计思路,包括整体考虑、实现方法和如何组合评价要素。评估函数是将局面量化为数值的过程,涉及子力、空间、机动性、着法、威胁、形状和图案等多个因素。文章讨论了一阶评价方法、棋子-格子数组以及评价要素的组合方式,强调了知识和速度在程序设计中的平衡。
摘要由CSDN通过智能技术生成

《对弈程序基本技术》专题

评价函数

David Eppstein */文

*加州爱尔文大学(UC Irvine)信息与计算机科学系

整体考虑

在你的程序中,评价函数综合了大量跟具体棋类有关的知识。我们从以下两个基本假设开始:

(1)我们能把局面的性质量化成一个数字。例如,这个数字可以是对取胜的概率作出的估计;但是大多数程序不给这个数字以如此确定的含义,因此这仅仅是一个数子而已。

(2)我们衡量的这个性质应该跟对手衡量的性质是一样的(如果我们认为我们处于优势,那么反过来对手认为他处于劣势)。真实情况并非如此,但是这个假设可以让我们的搜索算法正常工作,而且在实战中它跟真实情况非常接近。

评价可以是简单的或复杂的,这取决于你在程序中加了多少知识。评价越复杂,包含知识的代码就越多,程序就越慢。通常,程序的质量(它棋下得怎样)可以通过知识和速度的乘积来估计:

bbea5c3a2109a9352c71c45302100f57.gif

因此,如果你有一个快速而笨拙的程序,你通常可以加一些知识让它慢下来,使它工作得更好。但是同样是增加知识让程序慢下来,对一个比较聪明但很慢的程序来说,可能会更糟;知识对棋力的增长作用会减少的。类似地,你增加程序的速度,到一定程度后,速度对棋力的提高作用也会减少,你最好在速度和知识上寻求平衡,达到图表中间的位置。平衡点也会随着你面对的对手而改变;对于击败其他电脑,速度的表现更好,而人类对手则善于寻找你的程序中对于知识的漏洞,从而轻松击败基于知识的程序。【译注:如果你的程序要和人类棋手比,那么最好给程序加上足够多的知识。】

实现方法

就评价方法而言主要有两个类型。第一个是“终点评价”(End-Point Evaluation),即用你擅长的评价算法,简单地评价每个局面,而不受其他局面的影响。这通常会给出好的结果,但是非常慢。因此一些程序设计师用了下面的诀窍,称为预先计算(Pre-Computation),一阶评价(First-Order Evaluation),或棋子-格子数组(Piece-Square Tables)。

在我们对一个局面搜索最佳着法之前,我们认真检查棋局本身,在数组T[格子,棋子类型]中保存计算值。在搜索过程中评价任何局面,只要简单地把棋子在数组中的值加起来就行了。我们不必每一步都重新计算它们的和,在把棋子从一个格子移到另一个格子时,可以用下面的公式更新评价值:

score += T[新的格子,棋子] - T[旧的格子,棋子]

下面就举一个例子说明国际象棋中的棋子-格子数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值