AI Adversarial search 对抗搜索 minimax α-β剪枝 Expectimax

JM_1004

已于 2022-10-04 13:42:49 修改

阅读量1.4k

点赞数 2

分类专栏： AI 文章标签：人工智能

于 2022-10-04 00:59:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51158102/article/details/127158052

版权

总结基于ucb cs188AI课程，b站有课程链接，主要自用

目录

Types of game(博弈）

1.确定游戏（deterministic games）

2.zero-one games &general games

Adversarial search

1.对抗搜索：

1.游戏规则:

2.实现：Minmax algorithm

3.复杂度分析：与DFS相同

4.α-β Pruning（alpha-beta剪枝）

（2）实现（特别注意实现时α与β的更新）

(3)更直观的例子

(4)复杂度分析

5.evaluation functins估值函数

7.对以上的小总结

8.Mixed Layer Types

Types of game(博弈）

1.确定游戏（deterministic games）

2.zero-one games &general games

零和游戏：一方利益最大化，另一方利益最小化；只存在竞争

一般游戏：存在合作竞争等选择

Adversarial search

1.对抗搜索：

在给定agent与游戏状态的情况下，返回一种最佳的策略

2.概念

Value of a state：从当前状态出发所能得到的最大收益（utility)，记为V(s)

Terminal utility: 达到terminal state时所获得的最大收益

3.Minimax:

1.游戏规则:

博弈双方轮流决策，由此在博弈树中找到最大化自己利益（最小化对方利益）的决策(假设他们都足够理性与聪明得到最佳策略)：例如，如下图，V(s)代表吃豆人的利益，当幽灵决策时，它会从{-8，5}中选择-8，从{-10，8}中选择-10最小化吃豆人的利益，而吃豆人决策时，会从{-8，-10}中选择-8最大化其利益。在此场景中，幽灵属于最小层(min)，吃豆人属于最大层(max)

<

最低0.47元/天解锁文章

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
AI Adversarial search 对抗搜索 minimax α-β剪枝 Expectimax

人工智能Adversarial search 对抗搜索小结，课程参考来源ucb cs188，b站有视频
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。