MCTS (Monte Carlo Tree Search)

本文介绍了蒙特卡洛树搜索(MCTS)的基本概念和核心处理过程,包括选择、扩展、模拟和反向传播四个阶段。MCTS是一种结合探索与利用的决策制定方法,广泛应用于解决未知环境中的优化问题。文中还详细解释了UCT算法,它是MCTS中的关键选择策略,旨在平衡已知最佳路径和未知领域的探索。MCTS的优点在于其通用性和非对称性的树形结构,能够在多种问题领域中适应并表现出色。
摘要由CSDN通过智能技术生成

以下文章摘录自:

《机器学习观止——核心原理与实践》

京东: https://item.jd.com/13166960.html

当当:http://product.dangdang.com/29218274.html

(由于博客系统问题,部分公式、图片和格式有可能存在显示问题,请参阅原书了解详情)

 

 

MCTS (Monte Carlo Tree Search)

1.1        MCTS概述

在前面的学习中,我们分析了蒙特卡洛方法,本章节将为大家解开蒙特卡洛树搜索的“面纱”。虽然它们的名字很接近,但大家需要注意的是这两者却有着本质区别。

我们先简单回顾一下Monte Carlo Method,它起源于二战时期的“曼哈顿计划”。一方面是出于保密性考虑,另一方面蒙特卡洛方法本身就和随机事件相关联,所以冯诺依曼等科学家就以世界闻名的摩纳哥赌城为其命名,即Monte Carlo。

MC Method是一系列方法的统称,其核心思想简单来说就是通过有规律的“试验”来获取随机事件出现的概率,并通过这些数据特征来尝试得到所求问题的答案的近似解。这样子描述可能有点抽象,下面我们举一个利用蒙特卡洛方法来求圆周率的经典例子。

大家都知道圆周率是数学及物理学中的一个数学常数,它等于圆形面积S和半径(r)平方的比值,即:

S1 = r2

另外,正方形的面积计算公式是边长(假设为2r)的平方:

S2 = (2r)2

那么如果把圆放在正方形里面,就形成了如下所示的图形:

图  利用蒙特卡洛方法求解圆周率(1)

 

紧接着我们在这个图形里随机产生N(通常在10000以上)个随机数,如下图所示:

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值