AI(人工智能:一种现代的方法)学习之: 不确定性(Uncertainty)Expectimax & multi-agent(多代理)

文章目录

Expectimax

  • 在最大最小搜索树中引入了概率
  • 因为在大多数情况下的真实世界都是按照概率发生事件的
    在这里插入图片描述

在这里插入图片描述

  • 但是 expectimax 不能进行和 minimax 相似的剪枝策略因为要计算每个绿色节点的具体值需要将所有的叶子结点都遍历一下然后根据概率求出;因此不能使用剪枝策略
    在这里插入图片描述

Multi-Agent

  • 之前讨论的情况都是两个代理之间的对抗搜索,在对砍搜索的情境下两个 agent 使用的博弈方法是 sum-zero 博弈,即都认为对方的策略是最优的,因此自己也做出最优的策略。
  • 但是在多个 agent 的情境下,既有可能出现对抗的情况也有可能出现合作的情况。

在这里插入图片描述

  • 在上述例子中的所有叶子节点中都有 3 个值,三种颜色分别代表 红 蓝 绿 agent 在当前分支中通过 utility function 算出的值。
  • 先看左边的分支,绿色节点直接和叶子节点接触,左侧分支的 绿色节点选出 1,6,6 和 6,1,2 这种情况的时候,蓝色只能从这两个里面挑一个最好的情况,而恰好,蓝色的最大值 6 和 绿色的最大值 6 同时出现在同一个叶子节点中,因此这时候蓝色和 绿色是双赢的情况,即他们同时最大化了自己的收益。
    在这里插入图片描述
  • 再看右边的分支中,绿色选出的两组数据中并不包含蓝色的最大值的情况,蓝色最终只能在(5,1,7)和 (5,3,5) 中选则包含较大蓝色值的 (5,2,5);但是在叶子节点中的蓝色最大值是 7,这个时候蓝色和绿色代理就不能同时获得最大的收益
    在这里插入图片描述
  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

暖仔会飞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值