极大极小搜索策略一般都是使用在一些博弈类的游戏之中:
这样策略本质上使用的是深度搜索策略,所以一般可以使用递归的方法来实现。在搜索过程中,对本方有利的搜索点上应该取极大值,而对本方不利的搜索点上应该取极小值。
极小值和极大值都是相对而言的。
在搜索过程中需要合理的控制搜索深度,搜索的深度越深,效率越低,但是一般来说,走法越好。
极大极小搜索可以分开写,也可以放在一起写。
主要的算法步骤如下:
输入:搜索的深度
输出:节点的最佳走法,及其对应的最佳估值
函数形式:int minMaxSearch(int depth ) 这里也可以添加int side参数表示当前谁是走棋方
如果轮到红方走棋,则
初始化最优值best = 负无穷大 //极大点 ,这里认为红方先走棋
否则
初始化最优值best = 正无穷大 //极小点
如果depth<= 0
调用评估函数值
否则
生成当前所有合理的走法
对每一步走法
执行走法
调用minMaxSearch(depth -1 ) , 并把值赋给value
撤销走法
如果轮到红方走棋,则
如果value > best
best = value
如果depth == MAX_DEPTH
bestMove = mv
否则
如果value < best
best = value
如果depth == MAX_DEPTH
bestMove = mv
返回best
在局面评估函数中一般返回双方优势的差值,以此作为评估值。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
这里总结一下负极大值搜索策略:
一个局面对红方的优势为X,那么对于黑方的优势就是-X;一个局面对红方的优势为-X,对黑方的优势就是X。在负极大值搜索算法中,没有了极小点,只有极大点。需要注意的是,局面对一方的优势转化为另一方的优势时需要加负号。局面估计区间是一个关于0点对称的区间:
[-MaxValue,MaxValue].需要注意的是,为了能使负极大值搜索算法得到正确的评价,必须修改局面评估函数的返回值,原来在极大极小搜索算法中始终返回的是红方的优势,现在要改为当前走棋方的优势。
负极大值搜索算法:
输入:搜索深度
输出:节点的最佳走法,及对应的最佳估值
函数形式:int negaMaxSearch(int depth)
初始化最优值best=负无穷大 //都是极大点
如果depth小于等于0
调用评估函数,并将结果赋给value
返回value值
否则
生成当前所有合法的走法
对于每一步走法
执行走法
value= -negaMaxSearch(depth-1) //注意函数之前有负号
撤销走法
如果 value> best
best=value
如果 depth == Max_Depth
bestMove=mv
返回best //返回某个搜索分支的最优评估值
评估函数的算法:
输入