Adversarial Search

L-李俊漩

于 2024-10-09 03:16:49 发布

阅读量903

点赞数 24

分类专栏： CS502K-Symbolic 文章标签：算法人工智能机器学习

本文链接：https://blog.csdn.net/sinat_39179993/article/details/142720221

版权

CS502K-Symbolic 专栏收录该内容

7 篇文章

订阅专栏

Adversarial Search（对抗性搜索）是一种用于解决双人零和博弈（如棋类游戏、井字棋、围棋等）的问题的搜索技术。在这些游戏中，玩家的目标是最大化自己的收益，而同时最小化对手的收益，因此称为对抗性。这类搜索方法的目的是在考虑到对手最佳策略的情况下，为自己找到最优解。

核心概念

零和博弈：
- 对抗性搜索通常应用于零和博弈，即一方的得分增加会直接导致另一方的得分减少，总和为零。例如象棋和井字棋，只有一个赢家，另一个则是输家或平局。
博弈树（Game Tree）：
- 对抗性搜索问题可以表示为博弈树，其中每个节点表示当前游戏的状态，分支则表示所有可能的动作。树的根节点代表游戏的起始状态，子节点表示每一步可能的结果。
最大化和最小化（Maximizing and Minimizing）：
- 在对抗性搜索中，玩家分为两个角色：
  - Max（最大化玩家）：通常表示当前正在做出决策的玩家，他们的目标是最大化其得分。
  - Min（最小化玩家）：对手的角色，目标是通过做出最佳决策来最小化 Max 的得分。
- Max 和 Min 交替进行决策，分别在树的不同层次中做出最佳选择。

Minimax 算法

Minimax 算法 是最经典的对抗性搜索算法。它通过递归评估博弈树中的所有可能分支，找到一个确保即便对手采取最优策略时也能为自己选择最佳动作的策略。

Minimax 算法的基本思想：
- Max 尽量选择对自己最有利的行动。
- Min 则尽量让 Max 的得分最小。

具体步骤：

构建博弈树：根据当前游戏状态，生成所有可能的行动以及对应的后续状态，直到到达终局（游戏结束状态）。
评估叶子节点：为每一个终局状态分配一个评分（通常是一个胜负或平局的分数），这一步由游戏的规则决定。
递归回溯计算：
- 从博弈树的叶子节点开始回溯计算。
- Max 层：玩家选择能带来最高分数的行动。
- Min 层：对手选择能带来最低分数的行动。
选择最佳行动：通过递归，根节点返回的值就是双方采取最佳策略下，当前玩家能获得的最优结果。

Minimax 示例：

假设游戏有一个小型博弈树如下：

        Max
         |
     ------------
    |      |     |
   Min    Min    Min
   1      4      3

在这个例子中，Max 需要从3个可能的选择中做决策。它会选择 4，因为这是在 Min 做出最优反应后，能获得的最大值。

Minimax 伪代码：

def minimax(state, depth, maximizing_player):
    if depth == 0 or is_terminal(state):
        return evaluate(state)
    
    if maximizing_player:
        max_eval = float('-inf')
        for child in get_children(state):
            eval = minimax(child, depth - 1, False)
            max_eval = max(max_eval, eval)
        return max_eval
    else:
        min_eval = float('inf')
        for child in get_children(state):
            eval = minimax(child, depth - 1, True)
            min_eval = min(min_eval, eval)
        return min_eval