Alpha值代表的是发起走棋一方(期望极大值)做能接受的最小值,搜索极大值一方必须要找到一个比Alpha值更大的,否则这步棋就没有任何意义
Beta值代表的是对手(期望极小值)所能接受的最坏值,搜索极小值的一方必须找到一个比Beta值更小的一步棋,否则也是没意义的(因为有更好的一步棋已经生成了)
先看函数调用方式
int AlphaBeta(int depth, int alpha, int beta);
AlphaBeta(5, -INFINITE INFINITE);
这是发起走棋一方(搜索极大值的一方)调用的,因此设定为alpha为
-INFINITE;
这里假设是采用负极大值算法的
int AlphaBeta(int depth, int alpha, int beta)
{
if(depth == 0 || IsGameOver()) return Evaluate(); //如果层数为0或者已达最终状态则返回本步棋的估值
for(each possible move)
{
MakeMove();
int val = -AlphaBeta(depth - 1, -beta, -alpha);
UnMakeMove();
if(val >= beta)
{
return val;
//注意,这里需要返回val,因为上一层应该知道具体搜索到的值,以配合各种Alpha-Beta算法的变种
}
if(val > alpha)
{
alpha = val;
...
//当然 这里还需要记录这步最佳的走法
}
}
return alpha;//返回最好的值
}
首先假设是负极大算法,
Alpha值是父节点(非root)能搜索到的最大值,任何比他小的值都没意义。
Beta值是你所能找到的最坏的一种情况,任何比它大的都没意义。
{
int val = -AlphaBeta(depth - 1, -beta, -alpha);
}
注意这个所谓的负极大的估值函数是估算本方的最优值,所以你的对手(子节点)估算出来的最优值如果大于你的-Beta
例如-beta == 3 子节点估值== 4,那么他实际上返回后(取负得-4)是小于你的Beta,所以它是有意义的。再看这个-alpha,
实际上是本层的beta是上一层节点(对手)的最大值的负值,如果任何本层节点取值,例如-alpha == 3,子节点估值为4,
4 >= 3,那么返回的是-4,-4< -3(alpha那个地方),所以无意义,因为在本层所有节点又都是越取越大(负极大),
所以本层也就没必要找了,直接剪枝了
btw: 我个人总感觉研究递归如果深入的去考虑stack frame是很愚蠢的,几乎越想越乱,几乎能疯了,呵呵
Beta值代表的是对手(期望极小值)所能接受的最坏值,搜索极小值的一方必须找到一个比Beta值更小的一步棋,否则也是没意义的(因为有更好的一步棋已经生成了)
先看函数调用方式
int AlphaBeta(int depth, int alpha, int beta);
AlphaBeta(5, -INFINITE INFINITE);
这是发起走棋一方(搜索极大值的一方)调用的,因此设定为alpha为
-INFINITE;
这里假设是采用负极大值算法的
int AlphaBeta(int depth, int alpha, int beta)
{
if(depth == 0 || IsGameOver()) return Evaluate(); //如果层数为0或者已达最终状态则返回本步棋的估值
for(each possible move)
{
MakeMove();
int val = -AlphaBeta(depth - 1, -beta, -alpha);
UnMakeMove();
if(val >= beta)
{
return val;
//注意,这里需要返回val,因为上一层应该知道具体搜索到的值,以配合各种Alpha-Beta算法的变种
}
if(val > alpha)
{
alpha = val;
...
//当然 这里还需要记录这步最佳的走法
}
}
return alpha;//返回最好的值
}
首先假设是负极大算法,
Alpha值是父节点(非root)能搜索到的最大值,任何比他小的值都没意义。
Beta值是你所能找到的最坏的一种情况,任何比它大的都没意义。
{
int val = -AlphaBeta(depth - 1, -beta, -alpha);
}
注意这个所谓的负极大的估值函数是估算本方的最优值,所以你的对手(子节点)估算出来的最优值如果大于你的-Beta
例如-beta == 3 子节点估值== 4,那么他实际上返回后(取负得-4)是小于你的Beta,所以它是有意义的。再看这个-alpha,
实际上是本层的beta是上一层节点(对手)的最大值的负值,如果任何本层节点取值,例如-alpha == 3,子节点估值为4,
4 >= 3,那么返回的是-4,-4< -3(alpha那个地方),所以无意义,因为在本层所有节点又都是越取越大(负极大),
所以本层也就没必要找了,直接剪枝了
btw: 我个人总感觉研究递归如果深入的去考虑stack frame是很愚蠢的,几乎越想越乱,几乎能疯了,呵呵