最大最小法及α-β剪枝算法图解

xrying621

已于 2023-03-29 01:20:22 修改

阅读量6.9k

点赞数 14

分类专栏： AI 文章标签：剪枝算法机器学习

于 2022-10-10 23:05:51 首次发布

本文为原创文章，遵循 CC 4.0 BY-SA 版权协议，未经本人许可不得转载，不得用于商业用途，获得许可后转载需附原文链接和本声明，否则保留追究法律责任的权利。

本文链接：https://blog.csdn.net/xrying621/article/details/127254462

版权

AI 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

（网上讲的都不是很好理解，贡献一下之前听慕课做的笔记，适合初学者比较简洁明了。）

要想理解α-β剪枝算法，必须从最大最小法的博弈问题讲起！注意不懂的同学不要跳过这一节。

最大最小法

场景：双方博弈

前提：假设有两个人比赛取数字，一个人想尽可能的取大，另一个人想尽可能取小，数字的大小作为双方胜负的判断标准。从最底层叶子节点开始取数，两个人一人取一次，每次只能从上一次(即下一层）的结果中取数，最终根据最后一层节点(也就是最上方根节点）的值的大小(学名叫做评估值）进行胜负角逐。想取大的人给他取名MAX，他在根结点的评估值越大时越会赢（+ꝏ一定赢），想取小的人叫做MIN，他在根结点的评估值越小时越会赢（-ꝏ一定赢）。若值为0时表示两人平手。

如下图，考察距离最终根结点向前3步时(即考察深度为3），各节点的评估值。假设最后一步(第0层）是MAX来取数，往前三步分别是MIN,MAX,MIN取数。倒推着来看，若两个人都想赢，分别会再各自取数时怎么去做。MAX在根节点S选择后继节点时，下一层的评估值分别是3,1，则MAX应选择更大的一条路即SA。

看图上标注的第0-第3层，在第0层时，MAX可以选择第1层的AB节点的值，往前倒推，MIN在第1层时AB的值又分别可以选择第2层CDE和FG的值，MAX在第2层时可以选择第3层H-Q的值。

首先看最后一步，当处于第2层时MAX要作出决定，从H-Q中选择一个更大的值，那么C节点应该选择的就是H(因为H表示5，比I表示的0大，为了赢MAX要尽量选择更大的值才有可能赢）；D对应K，EFG的评估值分别为最大的LOQ，即3，3，1；

MAX在第2层选完以后，MIN在第1层时为了赢必会选值更小的，即A选3(D或E），B选1(G）。

(——这里的假设前提：博弈双方均会选择对自己最有利的方法去做。）

考察深度越深，算法博弈水平越高。不需要生成所有博弈树，只要到规定的深度即可。