重读Alpha-Beta算法

Alpha值代表的是发起走棋一方(期望极大值)做能接受的最小值,搜索极大值一方必须要找到一个比Alpha值更大的,否则这步棋就没有任何意义
    Beta值代表的是对手(期望极小值)所能接受的最坏值,搜索极小值的一方必须找到一个比Beta值更小的一步棋,否则也是没意义的(因为有更好的一步棋已经生成了)

先看函数调用方式
int AlphaBeta(int depth, int alpha, int beta);

AlphaBeta(5, -INFINITE INFINITE);
这是发起走棋一方(搜索极大值的一方)调用的,因此设定为alpha为
-INFINITE;


这里假设是采用负极大值算法的

int AlphaBeta(int depth, int alpha, int beta)
{
   if(depth == 0 || IsGameOver()) return Evaluate(); //如果层数为0或者已达最终状态则返回本步棋的估值
   for(each possible move)
   {
     MakeMove();
    
     int val = -AlphaBeta(depth - 1, -beta, -alpha);
     UnMakeMove();
  
  if(val >= beta)
  {
    return val;
    //注意,这里需要返回val,因为上一层应该知道具体搜索到的值,以配合各种Alpha-Beta算法的变种
  }

     if(val > alpha)
  {
    alpha = val;
    ...
    //当然 这里还需要记录这步最佳的走法
  }
    
    
   }
   return alpha;//返回最好的值
}




首先假设是负极大算法,
Alpha值是父节点(非root)能搜索到的最大值,任何比他小的值都没意义。
Beta值是你所能找到的最坏的一种情况,任何比它大的都没意义。
{
  int val = -AlphaBeta(depth - 1, -beta, -alpha);
}
注意这个所谓的负极大的估值函数是估算本方的最优值,所以你的对手(子节点)估算出来的最优值如果大于你的-Beta
例如-beta == 3 子节点估值== 4,那么他实际上返回后(取负得-4)是小于你的Beta,所以它是有意义的。再看这个-alpha,
实际上是本层的beta是上一层节点(对手)的最大值的负值,如果任何本层节点取值,例如-alpha == 3,子节点估值为4,
4 >= 3,那么返回的是-4,-4< -3(alpha那个地方),所以无意义,因为在本层所有节点又都是越取越大(负极大),
所以本层也就没必要找了,直接剪枝了

btw: 我个人总感觉研究递归如果深入的去考虑stack frame是很愚蠢的,几乎越想越乱,几乎能疯了,呵呵
 
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值