Minimax Search(极大极小搜索)(博弈树的启发式搜索)

/# Minimax Search(极大极小搜索)(博弈树的启发式搜索)

Minimax

The first zero-sum-game algorithm we will consider is minimax, which runs under the motivating assumption that the opponent we face behaves optimally, and will always perform the move that is worst for us.

极大极小搜索常用于两个人的零和游戏(博弈),在算法中,我们假设对手总是会做出最优的决定,即总是做出对我们最坏的行动。

极大层(Max Layer):玩家选择使其得分最大的操作,极大节点的值为其子节点中的最大状态值(或节点)

极小层(Min Layer):对手选择使得玩家得分最低的操作,极小节点的值为其子节点中的最小状态值(与节点)

Alpha-Beta Pruning(α-β剪枝)

α值:极大节点的最大值

β值:极小节点的最小值

如何剪枝:

  • 任何Max节点n的α值大于或等于它先辈节点的β值,则n以下的分支可停止搜索,这种剪枝成为β剪枝
  • 任何Min节点n的β值小于或等于它先辈节点的α值,则n以下的分支可停止搜索,这种剪枝成为α剪枝

Evaluation Function(评估函数)

在实际情况中,一个极大极小状态空间树可能深度很大,就可能需要评估函数估计非终端节点的价值,提供近似的决策依据

如:

Eval(s) = w1f1(s)+w2f2(s)+…+wnfn(s)

这是一个评估函数,它将几个特征fn(s)线性组合,特征权重为Wn。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值