AlphaBeta剪枝算法求解博弈树最优选择

十有久诚

已于 2024-05-18 14:24:41 修改

阅读量983

点赞数 21

文章标签：人工智能机器学习

于 2024-05-18 14:19:00 首次发布

本文链接：https://blog.csdn.net/weixin_50917576/article/details/139024786

版权

任务描述

学习人工智能博弈算法中的 AlphaBeta 剪枝技巧，并基于 MinMax 算法编程实现如下图博弈树最优值问题的求解。

博弈树的输入形式为字符串：[A, [B, (E, 3), (F, 12), (G, 8)], [C, (H, 2), (I, 4), (J, 6)], [D, (K, 14), (L, 5), (M, 2)]]，其中 [] 里的第一项为结点名称，后面的 [] 或 () 为子结点，而 () 里边则为叶子结点名称及其值。通过 Python 中的 ast.literal_eval 模块可以将该字符串数据解析为数据在 Python 数据类型里本应该存在的形式，在本例子中即为列表和元组，使用方法可见文件目录中的 testAlphaBeta.py 文件。

学员需要将列表和元组组成的数据构建成一棵如上图所示的博弈树，然后求解最优值，该博弈树的根结点为 Max 层，上图所示的最优结点为 B ，最优值为 3 。

编程要求

本关的编程任务是补全右侧代码片段 buildTree 、minmax_with_alphabeta 、max_value 、min_value 、get_value 和 isTerminal 中 Begin 至 End 中间的代码，具体要求如下：

在 buildTree 中，以递归的方式创建一棵博弈树，初始传入参数为博弈树的根结点 root ，以及解析后的列表与元组的组合数据 data_list；

在 minmax_with_alphabeta 中，基于 AlphaBeta 剪枝思想实现 MinMax 算法主体部分，初始传入参数为博弈树的根结点，函数最后返回根结点的最优决策结点；

在 max_value 中，计算该博弈树结点的子结点中的最大的评估值，并返回，传入参数为结点以及 Alpha 和 Beta 区间上下限；

在 min_value 中，计算该博弈树结点的子结点中的最小的评估值，并返回，传入参数为结点以及 Alpha 和 Beta 区间上下限；

在 get_value 中，返回结点 node 的值，即为 node.val；

在 isTerminal 中，判断某结点是否为最终结点（叶子结点），也就是说是否有子结点。

测试说明

平台将自动编译补全后的代码，并生成若干组测试数据，接着根据程序的输出判断程序是否正确。

以下是平台的测试样例：

测试输入：

[A, [B, (E, 3), (F, 12), (G, 8)], [C, (H, 2), (I, 4), (J, 6)], [D, (K, 14), (L, 5), (M, 2)]]

预期输出：

B 3

代码实现

# -*- coding:utf-8 -*-

import copy     # 注意对象的深拷贝和浅拷贝的使用！！！

class GameNode:
    '''博弈树结点数据结构
    成员变量：
    name - string 结点名字
    val - int  结点值
    children - list[GameNode] 子结点列表
    '''
    def __init__(self, name='', val=0):
        self.name = name        # char
        self.val = val          # int
        self.children = []      # list of nodes

class GameTree:
    '''博弈树结点数据结构
    成员变量：
    root - GameNode 博弈树根结点
    成员函数：
    buildTree - 创建博弈树
    '''
    def __init__(self):
        self.root = None                # GameNode 博弈树根结点

    def buildTree(self, data_list, root):
        '''递归法创建博弈树
        参数：
        data_list - list[] like this ['A', ['B', ('E', 3), ('F', 12)], ['C', ('H', 2)], ['D', ('K', 14)]]
        root - GameNode
        '''
        #请在这里补充代码，完成本关任务
        #********** Begin **********#
        del data_list[0]   
        for i in data_list:
            if isinstance(i,int):  
                root.val=i
            else:
                cur_dataList=list(i)   
                cur_node=GameNode(name=cur_dataList[0],val=0)  

                self.buildTree(cur_dataList,cur_node) 
                root.children.append(cur_node)

        #********** End **********#


class AlphaBeta:
    '''博弈树结点数据结构
    成员变量：
    game_tree - GameTree 博弈树
    成员函数：
    minmax_with_alphabeta - 带AlphaBeta剪枝的极大极小值算法，计算最优行动
    max_value - 计算最大值
    min_value - 计算最小值
    get_value - 返回结点的值
    isTerminal - 判断某结点是否为最终结点
    '''
    def __init__(self, game_tree):
        self.game_tree = game_tree      # GameTree 博弈树

    def minmax_with_alphabeta(self, node):
        '''带AlphaBeta剪枝的极大极小值算法，计算最优行动
        参数：
        node - GameNode 博弈树结点
        返回值：
        clf - GameNode 最优行动的结点
        '''
        #请在这里补充代码，完成本关任务
        #********** Begin **********#
        self.max_value(node,1000,-1000)
        for i in node.children:
            if i.val==node.val:
                return i

        #********** End **********#


    def max_value(self, node, alpha, beta):
        '''计算最大值
        参数：
        node - GameNode 博弈树结点
        alpha - int 剪枝区间下限值
        beta - int 剪枝区间上限值
        返回值：
        clf - int 子结点中的最大的评估值
        '''
        #请在这里补充代码，完成本关任务
        #********** Begin **********#
        if self.isTerminal(node):
            return node.val
        for i in node.children:
            new_clf=self.min_value(i,alpha,beta)
            beta=new_clf if new_clf>beta else beta
            if alpha<beta:
                break
        node.val=beta
        clf=beta
        return clf

        #********** End **********#


    def min_value(self, node, alpha, beta):
        '''计算最小值
        参数：
        node - GameNode 博弈树结点
        alpha - int 剪枝区间下限值
        beta - int 剪枝区间上限值
        返回值：
        clf - int 子结点中的最小的评估值
        '''
        #请在这里补充代码，完成本关任务
        #********** Begin **********#
        if self.isTerminal(node):
            return node.val
        
        for i in node.children:
            new_alpha=self.max_value(i,alpha,beta) 
            alpha=new_alpha if new_alpha<alpha else alpha
            if alpha<beta:
                break
        node.val=alpha
        return alpha

        #********** End **********#


    def get_value(self, node):
        '''返回结点的值
        参数：
        node - GameNode 博弈树结点
        返回值：
        clf - int 结点的值，即 node.val
        '''
        #请在这里补充代码，完成本关任务
        #********** Begin **********#
        return node.val;

        #********** End **********#


    def isTerminal(self, node):
        '''判断某结点是否为最终结点（无子结点）
        参数：
        node - GameNode 博弈树结点
        返回值：
        clf - bool 是最终状态，返回True，否则返回False
        '''
        #请在这里补充代码，完成本关任务
        #********** Begin **********#
        if len(node.children)>0:  
            return False
        return True #否则返回有

        #********** End **********#