java实现蒙特卡洛树搜索_对抗搜索(Adversarial Games)——Min-max搜索 & Aleph-beta剪枝搜索...

文章目录

一、对抗搜索是什么?

二、最小最大搜索(Minmax Search)

计算过程

minmax算法的性质和评价

三,Alpha-Beta剪枝搜索(Pruning Search)

计算过程

剪枝搜索的性质

一、对抗搜索是什么?

对抗搜索(Adversarial Search)也称为博弈搜索(Game Rearch)

在一个竞争的环境中,智能体(agents)之间通过竞争实现相反的利益,一方最大化这个利益,另一方最小化。

对抗搜索的方法主要有三个:

最小最大搜索(Minmax Search)

Alpha-Beta剪枝搜索(Pruning Search)

蒙塔卡洛树搜索(Monte-Caelo Tree Search)

最大最小搜索为对抗搜索中最基本的搜索方法;剪枝搜索是一种对最大最小搜索进行改进的算法,即在搜索过程中可以减去无需搜索的分支节点,且不影响搜索结果。蒙特卡洛树搜索通过采样而非穷举方法来实现搜索。

二、最小最大搜索(Minmax Search)

计算过程

这里只讲一个最简单的例子说明minmax search的计算过程。

假设根据当前局面我们得到一个下图所示的博弈树:

从上往下,单数层是我方行动,双数层是对方行动,我方行动需要选择对我最有利的行动,即value大的行动,对方行动则是选择使我方最不利的行动,即value小的行动。

我们需要从最底层第四层开始考虑,双数层所以是对方

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值