总结基于ucb cs188AI课程,b站有课程链接,主要自用
目录
2.zero-one games &general games
Types of game(博弈)
1.确定游戏(deterministic games)
2.zero-one games &general games
零和游戏:一方利益最大化,另一方利益最小化;只存在竞争
一般游戏:存在合作竞争等选择
Adversarial search
1.对抗搜索:
在给定agent与游戏状态的情况下,返回一种最佳的策略
2.概念
Value of a state:从当前状态出发所能得到的最大收益(utility),记为V(s)
Terminal utility: 达到terminal state时所获得的最大收益
3.Minimax:
1.游戏规则:
博弈双方轮流决策,由此在博弈树中找到最大化自己利益(最小化对方利益)的决策(假设他们都足够理性与聪明得到最佳策略):例如,如下图,V(s)代表吃豆人的利益,当幽灵决策时,它会从{-8,5}中选择-8,从{-10,8}中选择-10最小化吃豆人的利益,而吃豆人决策时,会从{-8,-10}中选择-8最大化其利益。在此场景中,幽灵属于最小层(min),吃豆人属于最大层(max)