博弈中的对抗搜索问题

最新推荐文章于 2023-12-20 20:40:29 发布

Moyu18_06_12

最新推荐文章于 2023-12-20 20:40:29 发布

阅读量2.9k

点赞数 2

分类专栏：算法设计文章标签： ai 博弈论极大极小值算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014296991/article/details/105611011

版权

本文探讨了在博弈环境中，如何通过优化决策来达到最优策略。介绍了极大极小值算法，包括MiniMax反推过程和α-β剪枝，以及在实际决策中的应用，如截断搜索和残局库在棋类游戏中的重要性。此外，还讨论了如何设计有效的评价函数以应对不完整的实时决策问题。

摘要由CSDN通过智能技术生成

博弈（Game）

多智能体环境下，智能体之间存在合作和竞争关系；
数学领域中的“博弈”：把任何多智能体环境看成是一种博弈游戏，如果其中每个智能体对其它智能体的影响是“显著的”，这些影响可以是合作或竟争。
人工智能领域中的“博弈”：确定性的、有完整信息的，轮流行动的，两个游戏者的零和游戏。
博弈的抽象本性成为AI研究者感兴趣的对象

AI中研究的博弈，即如何根据当前的棋局，选择对自己最有利的一步棋？

博弈的特点：

双方的智能活动，任何一方都不能单独控制博弈过程，而是由双方轮流实施其控制对策的过程。

博弈问题的表示：

用博弈树来表示，它是一种特殊的与或图。节点代表博弈的格局（即棋局），相当于状态空间中的状态，反映了博弈的信息。与节点、或节点隔层交替出现。

为什么与节点、或节点隔层交替出现？

假设博弈双方为：MAX和MIN

在博弈过程中，规则是双方轮流走步。在博弈树中，相当于博弈双方轮流扩展其所属节点。

从MAX方的角度来看：所有MIN方节点都是与节点

理由：因为MIN方必定选择最不利于MAX方的方式来扩展节点，只要MIN方节点的子节点中有一个对MAX方不利，则该节点就对MAX方不利，故为“与节点”。

从MAX方的角度来看：所有属于MAX方的节点都是“或节点”

理由：因为扩展MAX方节点时，MAX方可选择扩展最有利于自己的节点，只要可扩展的子节点中有一个对已有利，则该节点就对已有利。

在博弈树中，先行一方的初始状态对应树的根节点，而任何一方获胜的最终格局为目标状态，对应于树的终叶节点（可解节点或本原问题）。但是，从MAX的角度出发，所有使MAX获胜的状态格局都是本原问题，是可解节点，而使MIN获胜的状态格局是不可解节点。

博弈的例子：

一字棋
跳棋
中国象棋
围棋
五子棋

博弈中的优化决策(Optimal decisions)

问题的表述：两名游戏者MAX和MIN，MAX先行，然后两人轮流出招，直到游戏结束。
在游戏的最后，给优胜者奖分，给失败者罚分。
该问题可以形式化成为下面的搜索问题：

初始状态：包括棋盘局面和确定该哪个游戏者出招；

后继函数：返回(move, state)的一个列表；（move是合法招数，state是招数move所导致的状态）

最低0.47元/天解锁文章

关注

2
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。