极大极小算法井字棋人机对战软件应用（可与工业机器人串口通讯）

佘呀

于 2023-11-19 10:46:59 发布

阅读量231

点赞数 7

分类专栏：人工智能文章标签：机器人 ai 人机交互 c# 算法游戏

本文链接：https://blog.csdn.net/weixin_45593185/article/details/134474604

版权

人工智能专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、背景：

在当前人工智能高速发展的时代，多学习点与人工智能有关的知识是很好的，下面这个是我在休闲时间写的一个井字棋人机对战软件，应用的算法是极大极小值算法。

二、极大极小算法

应用背景：只要是你一步我一步的游戏，都可以应用这个极大极小值算法来进行计算最优解。极大极小值算法求解的过程其实就是个人机博弈的过程，在这个过程中，你想要谁获胜，那这个"人"它的目的就是要求极大值（对它最有力的情况，得分最高的情况）。

比较官方的说法：极大极小值算法主要由两步组成：极大值搜索和极小值搜索，我们需要的是极大值中的最大值。首先，极大值搜索会尝试搜索一个目标函数的最大值，即极值点；其次，极小值搜索会尝试搜索一个目标函数的最小值，即极小值点。最后，算法将最大值和最小值结合起来，得到最优解。

我的理解：其实就是遍历所有的游戏结果，然后往上以极大极小值往上递归，直到我们获得最大的极大值。以井字棋为例子，不管是"我"先手还是对方先手，最终都是"我"要获胜，所以我是要求极大值，那么这个条件下我们再来分析一下。

举个例子，如果是对方先手，那么我们下一步可以走的棋子就剩下八个，我们这一步就有八个选择可以走，每个选择下一次又会长生七个选择的棋路可以走（当然下一次是对手下棋），以此往下推，这样产生的情况数量其实是很多的。所以我们可以用电脑对各种情况进行推演，直到产生结果（平局，我/对方获胜)。

三种结果对应不同的分数，为了方便区分，分数可以这样设置，平局的情况下，到谁下这一步棋返回给给它的分数是0，如果是"我"赢，则返回的分数是正数，如果是对手赢，则返回的结果是负数。当然结果判定的分数值不能只是一个固定值，而是要有多种奖励条件，满足这个条件应该增加相对应的分数，奖励机制越复杂，AI的获胜几率越大。

当产生游戏结果的那一步棋子下后，要根据当时是"我"下（如果是"我"先手的情况下，对应全场棋子下的步数应该是奇数，反之则偶数）还是对手下（棋数与"我"相反）的棋子，分别挑选对应的分数。如果是"我"下的棋子，应该把这步棋子产生的分数与我保存最小值的变量进行对比，如果大于或者等于这个值，就要把这个值保存到这个变量里面去。如果是对手下的棋子，应该判断分数是否小于我保存最小值的变量，如果小于它，那应该把这个值保存到变量里面去。

当我们获取到想要的某个最终的分数后，要把这个值往上用函数递归上去，即反馈给"对手"当它上一步下之前，然后对手根据传过来的多种结果产生的分数，再次根据我上一段说的那个挑选分数的办法，进行分数挑选。最终当我们递归到第一步棋子，也就是"我"实际应该下的棋子的时候，我们从每个结果里面挑选最大的值，然后输出出去，给机器人，机器人变明白我们要下的是哪一步棋子了。

PS：我上面这种写法，需要遍历全部的结果，这样简单的游戏确实可以靠计算机强大的算力去获得结果，但是一旦遇到那种计算量大的游戏，就算是计算机也不是能全部算完的。而为了解决这种情况，我们可以通过αβ剪枝的方法对某一些没必要的过程进行删减，这个我会在后面的五子棋例子中写出来，目前比较忙和懒，没时间写。

下面展示一下我的实际成果：