AI(人工智能:一种现代的方法)学习之: 不确定性（Uncertainty）Expectimax & multi-agent（多代理）

最新推荐文章于 2024-01-19 10:49:08 发布

暖仔会飞

最新推荐文章于 2024-01-19 10:49:08 发布

阅读量1.5k

点赞数 1

分类专栏：软件工程学习内容文章标签：人工智能学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42902997/article/details/125044968

版权

软件工程学习内容专栏收录该内容

55 篇文章 22 订阅

订阅专栏

文章目录

Expectimax
Multi-Agent

Expectimax

在最大最小搜索树中引入了概率
因为在大多数情况下的真实世界都是按照概率发生事件的

但是 expectimax 不能进行和 minimax 相似的剪枝策略因为要计算每个绿色节点的具体值需要将所有的叶子结点都遍历一下然后根据概率求出；因此不能使用剪枝策略

Multi-Agent

之前讨论的情况都是两个代理之间的对抗搜索，在对砍搜索的情境下两个 agent 使用的博弈方法是 sum-zero 博弈，即都认为对方的策略是最优的，因此自己也做出最优的策略。
但是在多个 agent 的情境下，既有可能出现对抗的情况也有可能出现合作的情况。

在上述例子中的所有叶子节点中都有 3 个值，三种颜色分别代表红蓝绿 agent 在当前分支中通过 utility function 算出的值。
先看左边的分支，绿色节点直接和叶子节点接触，左侧分支的绿色节点选出 1,6,6 和 6,1,2 这种情况的时候，蓝色只能从这两个里面挑一个最好的情况，而恰好，蓝色的最大值 6 和绿色的最大值 6 同时出现在同一个叶子节点中，因此这时候蓝色和绿色是双赢的情况，即他们同时最大化了自己的收益。

再看右边的分支中，绿色选出的两组数据中并不包含蓝色的最大值的情况，蓝色最终只能在（5,1,7）和（5,3,5）中选则包含较大蓝色值的（5,2,5）；但是在叶子节点中的蓝色最大值是 7，这个时候蓝色和绿色代理就不能同时获得最大的收益

关注

1
点赞
踩
15

收藏

觉得还不错? 一键收藏
打赏
0
评论
AI(人工智能:一种现代的方法)学习之: 不确定性（Uncertainty）Expectimax & multi-agent（多代理）

文章目录ExpectimaxMulti-AgentExpectimax在最大最小搜索树中引入了概率因为在大多数情况下的真实世界都是按照概率发生事件的但是 expectimax 不能进行和 minimax 相似的剪枝策略因为要计算每个绿色节点的具体值需要将所有的叶子结点都遍历一下然后根据概率求出；因此不能使用剪枝策略Multi-Agent之前讨论的情况都是两个代理之间的对抗搜索，在对砍搜索的情境下两个 agent 使用的博弈方法是 sum-zero 博弈，即都认为对方的策略是最
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

暖仔会飞 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。