详解Minimax算法与α-β剪枝

最新推荐文章于 2025-03-12 20:24:04 发布

文剑木然

最新推荐文章于 2025-03-12 20:24:04 发布

阅读量3.5w

点赞数 263

分类专栏：博客文章标签：人工智能

本文链接：https://blog.csdn.net/wenjianmuran/article/details/90633418

版权

本文介绍了在双人对弈游戏中常用的Minimax算法及其优化版α-β剪枝。Minimax算法通过构建博弈树来预测最佳走法，而α-β剪枝则通过设置下界α和上界β来减少搜索空间，提高效率。通过实例详细解析了这两种算法的工作原理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在局面确定的双人对弈里，常采用博弈树搜索。我方追求更大的赢面，而对方会设法降低我方的赢面。由于局面确定，因此可以对赢面进行评估。我方往较大赢面的方向走，同时考虑对方的走法。由于对方的走法不确定，就假设对方会选择最大程度降低我方赢面的方向走，我方应规避那些对方可以大幅降低我方赢面的走法。

Minimax算法

称我方为MAX，对方为MIN，图示如下：

例如，对于如下的局势，假设从左往右搜索，根节点的数值为我方赢面（倒推值）：

我方应选择中间的路线。因为，如果选择左边的路线，最差的赢面是3；如果选择中间的路线，最差的赢面是15；如果选择右边的路线，最差的赢面是1。虽然选择右边的路线可能有22的赢面，但对方也可能使我方只有1的赢面，假设对方会选择使得我方赢面最小的方向走，那么经过权衡，显然选择中间的路线更为稳妥。

实际上，在看右边的路线时，当发现赢面可能为1就不必再去看赢面为12、20、22的分支了，因为已经可以确定右边的路线不是最好的。这个过程就是剪枝，可以避免不必要的计算。

$\alpha-\beta$ 剪枝

例如，对于如下的局势，假设从左往右搜索：

若已知某节点的所有子节点的倒推值，则可以算出该节点的倒推值：对于MAX节点，取最大倒推值；对于MIN节点，取最小倒推值。

若已知某节点的部分子节点的倒推值，虽然不能算出该节点的倒推值，但可以算出该节点的倒推值的取值范围。同时，利用该节点的倒推值的取值范围，在搜素其子节点时，如果已经确定没有更好的走法，就不必再搜索剩余的子节点了。

记 $v$ 为节点的倒推值，且 $\alpha \leq v \leq \beta$ ，即 $\alpha$ 为最大下界， $\beta$ 为最小上界。当 $\alpha \geq \beta$ 时，该节点剩余的分支就不必继续搜索了（也就是可以进行剪枝了）。注意，当 $\alpha = \beta$