目录
1 蒙特卡罗方法(Monte Carlo method)
2. 蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)
3 Upper Confidence Bounds(UCB)
正文
1 蒙特卡罗方法(Monte Carlo method)
像圆周率计算实验一样,用通过概率实验所求的概率估计来估计一个未知量,这样的方法统称为蒙特卡罗方法(Monte Carlo method)。
在现实世界中,大量存在一些复杂性过程,由于这类模型含有不确定的随机因素,我们很难直接用一个确定性模型来分析和描述。面对这种情况.数据科学家难以作定量分析,得不到解析的结果,或者是虽有解析结果,但计算代价太大以至不能使用。在这种情况下,可以考虑采用 Monte Carlo 方法 [1]。
2. 蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)算法
蒙特卡洛树搜索是一种基于树结构的蒙特卡洛方法,所谓的蒙特卡洛树搜索就是基于蒙特卡洛方法在整个2N(N等于决策次数,即树深度)空间中进行启发式搜索,基于一定的反馈寻找出最优的树结构路径(可行解)。概括来说就是,MCTS是一种确定规则驱动的启发式随机搜索算法 [1]。
以MC