人工智能实验二 利用α-β搜索的博弈树算法编写一字棋游戏

实验报告及相关程序(实验报告,代码等,不带水印的截图在附带资源中)

实验二 利用α-β搜索的博弈树算法编写一字棋游戏

一、实验目的 

理解和掌握博弈树的启发式搜索过程,能够用选定的编程语言实现简单的博弈游戏。

(1) 学习极大极小搜索及α-β 剪枝。

(2) 利用学到的算法实现一字棋

二、实验原理

2.1 游戏规则

"一字棋"游戏(又叫"三子棋"或"井字棋"),是一款十分经典的益智小游戏。"井字棋"的棋盘很简单,是一个 3×3 的格子,很像中国文字中的"井"字,所以得名"井字棋"。"井字棋"游戏的规则与"五子棋"十分类似,"五子棋"的规则是一方首先五子连成一线就胜利;"井字棋"是一方首先三子连成一线就胜利。

井字棋(英文名 Tic-Tac-Toe)

井字棋的出现年代估计已不可考,西方人认为这是由古罗马人发明的;但我们中国人认为,既然咱们都发明了围棋、五子棋,那发明个把井字棋自然是不在话下。这些纯粹是口舌之争了,暂且不提。

2.2 极小极大分析法

设有九个空格,由 MAX,MIN 二人对弈,轮到谁走棋谁就往空格上放一只自己的棋子,谁先使自己的棋子构成"三子成一线"(同一行或列或对角线全是某人的棋子),谁就取得了胜利。用圆圈表示 MAX,用叉号代表 MIN。

比如左图中就是 MAX 取胜的棋局。

估价函数定义如下:

设棋局为 P,估价函数为 e(P)。

(1) 若 P 对任何一方来说都不是获胜的位置,则 e(P)=e(那些仍为 MAX 空着的完全的行、列或对角线的总数)-e(那些仍为 MIN 空着的完全的行、列或对角线的总数)

(2) 若 P 是 MAX 必胜的棋局,则 e(P)=+∞ (实际上赋了 60)。

(3) 若 P 是 B 必胜的棋局,则 e(P)=-∞ (实际上赋了-20)。

比如 P 如下图示,则 e(P)=5-4=1

需要说明的是,+∞赋 60,-∞赋-20 的原因是机器若赢了,则不论玩家下一步是否会赢,都会走这步必赢棋。

2.3 α -β剪枝算法

上述的极小极大分析法,实际是先生成一棵博弈树,然后再计算其倒推值,至使极小极大分析法效率较低。于是在极小极大分析法的基础上提出了α-β 剪枝技术。

α -β 剪枝技术的基本思想或算法是,边生成博弈树边计算评估各节点的倒推值,并且根据评估出的倒推值范围,及时停止扩展那些已无必要再扩展的子节点,即相当于剪去了博弈树上的一些分枝,从而节约了机器开销,提高了搜索效率。

具体的剪枝方法如下:

(1) 对于一个与节点 MIN,若能估计出其倒推值的上确界 β,并且这个 β 值不大于MIN 的父节点(一定是或节点)的估计倒推值的下确界 α,即 α≥β,则就不必再扩展该 MIN节点的其余子节点了(因为这些节点的估值对 MIN 父节点的倒推值已无任何影响了)。这一过程称为 α 剪枝。

(2) 对于一个或节点 MAX,若能估计出其倒推值的下确界 α,并且这个 α 值不小于MAX 的父节点(一定是与节点)的估计倒推值的上确界 β,即 α≥β,则就不必再扩展该 MAX节点的其余子节点了(因为这些节点的估值对 MAX 父节点的倒推值已无任何影响 了)。这一过程称为 β 剪枝。从算法中看到:

(1) MAX 节点(包括起始节点)的 α 值永不减少;

(2) MIN 节点(包括起始节点)的 β 值永不增加。

在搜索期间,α 和 β 值的计算如下:

(1) 一个 MAX 节点的 α 值等于其后继节点当前最大的最终倒推值。

(2) 一个 MIN 节点的 β

  • 10
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值