第六章,总得来说,比较细致地讲了零和游戏中的极小极大值算法,还有对其强化的alpha-beta剪枝优化算法。然后,大概介绍了下截断搜索,多人游戏,几率游戏。
在竞争的环境中,每个智能体的目标是冲突的,于是就引出了对抗搜索问题——通常被称为博弈。
人工智能中的博弈专指博弈论专家们称为有完整信息的,确定性的,轮流行动的,两个游戏者的零和游戏。这意味着再确定性的,完全可观察的环境中的两个智能体必须交替行动,在游戏结束时效用值总是相等并符号相反的。
游戏可以形式地定义成含有下列组成部分的一类搜索问题:
*初始状态,包括棋盘局面和确定该哪个游戏者出招。
*后继函数,返回(move,state)对(两项分别为招数/状态)的一个列表,其中每一对表示一个合法的招数和其结果状态。
*终止测试,测试判断游戏是否结束。游戏结束的状态称为终止状态。
*效用函数(又称为目标函数或者收益函数),对终止状态给出一个数值。
每方的初始状态和合法招数定义了游戏的博弈树。
按照博弈的说法,我们说博弈树的深度是一步的,包括两个单方招数,每一个单方招数称为一层。
极小极大值算法的抽象表示:
MINIMAX-VALUE(n)=
UTILITY(n)当n为终止状态
max s belongs to Successors(n) MINIMAX-VALUE(s) 当n为MAX节点