AI Adversarial search 对抗搜索 minimax α-β剪枝 Expectimax

总结基于ucb cs188AI课程,b站有课程链接,主要自用

目录

Types of game(博弈)

1.确定游戏(deterministic games)

 2.zero-one games &general games

Adversarial search

1.对抗搜索:

2.概念

3.Minimax:

 1.游戏规则:

  2.实现:Minmax algorithm

 3.复杂度分析:与DFS相同

4.α-β Pruning(alpha-beta剪枝)

(1)介绍

(2)实现(特别注意实现时α与β的更新)

 (3)更直观的例子

(4)复杂度分析

5.evaluation functins估值函数

6.Expectimax

1.介绍

2.实现

3.剪枝:

7.对以上的小总结

8.Mixed Layer Types


Types of game(博弈)

1.确定游戏(deterministic games)

 2.zero-one games &general games

  零和游戏:一方利益最大化,另一方利益最小化;只存在竞争

  一般游戏:存在合作竞争等选择

Adversarial search

1.对抗搜索:

在给定agent与游戏状态的情况下,返回一种最佳的策略

2.概念

Value of a state:从当前状态出发所能得到的最大收益(utility),记为V(s)

Terminal utility: 达到terminal state时所获得的最大收益

3.Minimax:

 1.游戏规则:

博弈双方轮流决策,由此在博弈树中找到最大化自己利益(最小化对方利益)的决策(假设他们都足够理性与聪明得到最佳策略):例如,如下图,V(s)代表吃豆人的利益,当幽灵决策时,它会从{-8,5}中选择-8,从{-10,8}中选择-10最小化吃豆人的利益,而吃豆人决策时,会从{-8,-10}中选择-8最大化其利益。在此场景中,幽灵属于最小层(min),吃豆人属于最大层(max)

<
  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值