AI与Python - 游戏

游戏采用策略。每个玩家或团队在开始游戏之前都会制定策略,他们必须根据游戏中的当前情况更改或构建新策略。

搜索算法

您必须使用与上述相同的策略来考虑电脑游戏。请注意,搜索算法是计算出电脑游戏策略的算法。

这个怎么运作

搜索算法的目标是找到最佳的移动集合,以便它们可以到达最终目的地并获胜。这些算法使用每组游戏不同的获胜条件来找到最佳动作。

将计算机游戏可视化为树。我们知道树有节点。从根开始,我们可以进入最终的获胜节点,但是有最佳的移动。这是搜索算法的工作。这种树中的每个节点都代表一个未来状态。搜索算法搜索该树以在游戏的每个步骤或节点处做出决定。

组合搜索

使用搜索算法的主要缺点是它们本质上是详尽的,这就是为什么它们探索整个搜索空间以找到导致资源浪费的解决方案的原因。如果这些算法需要搜索整个搜索空间以找到最终解决方案,那将会更麻烦。

为了消除这种问题,我们可以使用组合搜索,它使用启发式搜索搜索空间并通过消除可能的错误移动来减小其大小。因此,这种算法可以节省资源。下面讨论一些使用启发式搜索空间并节省资源的算法 -

Minimax算法

它是组合搜索使用的策略,它使用启发式方法来加速搜索策略。Minimax策略的概念可以用两个玩家游戏的例子来理解,其中每个玩家试图预测对手的下一步动作并试图最小化该功能。此外,为了获胜,玩家总是试图根据当前情况最大化自己的功能。

启发式在像Minimax这样的策略中起着重要作用。树的每个节点都有一个与之关联的启发式函数。基于该启发式,它将决定向最有利于他们的节点迈进。

Alpha-Beta修剪

Minimax算法的一个主要问题是它可以探索不相关的树的那些部分,从而导致资源的浪费。因此,必须有一个策略来决定树的哪个部分是相关的,哪个部分是无关紧要的,并且将不相关的部分保留为未开发的。Alpha-Beta修剪就是这样一种策略。

Alpha-Beta修剪算法的主要目标是避免搜索没有任何解决方案的树的那些部分。Alpha-Beta修剪的主要概念是使用名为Alpha的两个边界,最大下限和Beta,最小上限。这两个参数是限制可能解决方案集的值。它将当前节点的值与alpha和beta参数的值进行比较,以便它可以移动到具有解决方案的树的一部分并丢弃其余部分。

Negamax算法

该算法与Minimax算法没有区别,但它具有更优雅的实现。使用Minimax算法的主要缺点是我们需要定义两个不同的启发式函数。这些启发式之间的联系是,对于一个玩家来说游戏的状态越好,对另一个玩家来说就越糟糕。在Negamax算法中,两个启发式函数的相同工作是在单个启发式函数的帮助下完成的。

建立机器人玩游戏
为了构建机器人在AI中玩两个玩家游戏,我们需要安装easyAI库。它是一个人工智能框架,提供构建双人游戏的所有功能。您可以借助以下命令下载它 -

pip install easyAI

最后硬币站立的机器人

在这个游戏中,会有一堆硬币。每个玩家必须从那堆中取出一些硬币。游戏的目标是避免将最后一枚硬币放入堆中。我们将使用类LastCoinStanding从继承TwoPlayersGame类的easyAI库。以下代码显示了此游戏的Python代码 -

如图所示导入所需的包 -

from easyAI import TwoPlayersGame, id_solve, Human_Player, AI_Player
from easyAI.AI import TT

现在,继承TwoPlayerGame类中的类来处理游戏的所有操作 -

class LastCoin_game(TwoPlayersGame):
   def __init__(self, players):

现在,定义将要开始游戏的玩家和玩家。

self.players = players
self.nplayer = 1

现在,定义游戏中的硬币数量,这里我们使用15个硬币进行游戏。

self.num_coins = 15

定义玩家在移动中可以获得的最大硬币数量。

self.max_coins = 4

现在有一些特定的东西需要定义,如下面的代码所示。定义可能的动作。

def possible_moves(self):
   return [str(a) for a in range(1, self.max_coins + 1)]

定义硬币的移除

def make_move(self, move):
   self.num_coins -= int(move)

定义谁拿了最后一枚硬币。

def win_game(self):
   return self.num_coins <= 0

定义何时停止游戏,即有人获胜。

def is_over(self):
   return self.win()

定义如何计算分数。

def score(self):
   return 100 if self.win_game() else 0

定义堆中剩余的硬币数量。

def show(self):
   print(self.num_coins, 'coins left in the pile')
if __name__ == "__main__":
   tt = TT()
   LastCoin_game.ttentry = lambda self: self.num_coins

使用以下代码块解决游戏问题 -

r, d, m = id_solve(LastCoin_game,
   range(2, 20), win_score=100, tt=tt)
print(r, d, m)

决定谁将开始游戏

game = LastCoin_game([AI_Player(tt), Human_Player()])
game.play()

你可以找到以下输出和这个游戏的简单游戏 -

d:2, a:0, m:1
d:3, a:0, m:1
d:4, a:0, m:1
d:5, a:0, m:1
d:6, a:100, m:4
1 6 4
15 coins left in the pile
Move #1: player 1 plays 4 :
11 coins left in the pile
Player 2 what do you play ? 2
Move #2: player 2 plays 2 :
9 coins left in the pile
Move #3: player 1 plays 3 :
6 coins left in the pile
Player 2 what do you play ? 1
Move #4: player 2 plays 1 :
5 coins left in the pile
Move #5: player 1 plays 4 :
1 coins left in the pile
Player 2 what do you play ? 1
Move #6: player 2 plays 1 :
0 coins left in the pile

一个玩Tic Tac Toe的机器人

Tic-Tac-Toe是非常熟悉的,也是最受欢迎的游戏之一。让我们使用Python中的easyAI库来创建这个游戏。以下代码是这个游戏的Python代码 -

如图所示导入包 -

from easyAI import TwoPlayersGame, AI_Player, Negamax
from easyAI.Player import Human_Player

继承TwoPlayerGame类中的类来处理游戏的所有操作 -

class TicTacToe_game(TwoPlayersGame):
   def __init__(self, players):

现在,定义将要开始游戏的玩家和玩家 -

self.players = players
self.nplayer = 1

定义板的类型 -

self.board = [0] * 9

现在有一些事情需要定义如下 -

定义可能的动作

def possible_moves(self):
   return [x + 1 for x, y in enumerate(self.board) if y == 0]

定义玩家的移动 -

def make_move(self, move):
   self.board[int(move) - 1] = self.nplayer

为了提升AI,定义玩家何时移动 -

def umake_move(self, move):
   self.board[int(move) - 1] = 0

定义对手在一条线上有三个的失败条件

def condition_for_lose(self):
   possible_combinations = [[1,2,3], [4,5,6], [7,8,9],
      [1,4,7], [2,5,8], [3,6,9], [1,5,9], [3,5,7]]
   return any([all([(self.board[z-1] == self.nopponent)
      for z in combination]) for combination in possible_combinations])

定义一个游戏结束的检查

def is_over(self):
   return (self.possible_moves() == []) or self.condition_for_lose()

显示游戏中玩家的当前位置

def show(self):
   print('\n'+'\n'.join([' '.join([['.', 'O', 'X'][self.board[3*j + i]]
      for i in range(3)]) for j in range(3)]))

计算分数。

def scoring(self):
   return -100 if self.condition_for_lose() else 0

定义定义算法并开始游戏的主要方法 -

if __name__ == "__main__":
   algo = Negamax(7)
   TicTacToe_game([Human_Player(), AI_Player(algo)]).play()

你可以看到以下输出和这个游戏的简单游戏 -

. . .
. . .
. . .
Player 1 what do you play ? 1
Move #1: player 1 plays 1 :
O . .
. . .
. . .
Move #2: player 2 plays 5 :
O . .
. X .
121
. . .
Player 1 what do you play ? 3
Move #3: player 1 plays 3 :
O . O
. X .
. . .
Move #4: player 2 plays 2 :
O X O
. X .
. . .
Player 1 what do you play ? 4
Move #5: player 1 plays 4 :
O X O
O X .
. . .
Move #6: player 2 plays 8 :
O X O
O X .
. X .
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值