《人工智能——一种现代方法》(第二版)【第6章 对抗搜索】小结

本文详细总结了《人工智能——一种现代方法》第二版中关于对抗搜索的第六章内容,重点探讨了零和游戏中的极小极大值算法和Alpha-Beta剪枝优化技术。介绍了博弈树的概念,分析了算法的时间复杂度,并讨论了多人游戏、几率游戏以及如何应对实时决策的挑战。还提到了启发式评价函数和截断搜索在优化搜索效率中的作用。
摘要由CSDN通过智能技术生成

第六章,总得来说,比较细致地讲了零和游戏中的极小极大值算法,还有对其强化的alpha-beta剪枝优化算法。然后,大概介绍了下截断搜索,多人游戏,几率游戏。

在竞争的环境中,每个智能体的目标是冲突的,于是就引出了对抗搜索问题——通常被称为博弈。

人工智能中的博弈专指博弈论专家们称为有完整信息的,确定性的,轮流行动的,两个游戏者的零和游戏。这意味着再确定性的,完全可观察的环境中的两个智能体必须交替行动,在游戏结束时效用值总是相等并符号相反的。

游戏可以形式地定义成含有下列组成部分的一类搜索问题:

*初始状态,包括棋盘局面和确定该哪个游戏者出招。

*后继函数,返回(move,state)对(两项分别为招数/状态)的一个列表,其中每一对表示一个合法的招数和其结果状态。

*终止测试,测试判断游戏是否结束。游戏结束的状态称为终止状态。

*效用函数(又称为目标函数或者收益函数),对终止状态给出一个数值。

每方的初始状态和合法招数定义了游戏的博弈树。

按照博弈的说法,我们说博弈树的深度是一步的,包括两个单方招数,每一个单方招数称为一层。

极小极大值算法的抽象表示:

MINIMAX-VALUE(n)= 

                                        UTILITY(n)当n为终止状态

                                        max s belongs to Successors(n) MINIMAX-VALUE(s) 当n为MAX节点

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值