蒙特卡洛树搜索是由前里尔第三大学助理教授 Rémi Coulom 在围棋程序 Crazy Stone 中首先引入的方法——后者是第一个在围棋上达到职业五段水平的计算机程序。
从最直观的角度来看,蒙特卡洛树搜索有一个主要目的:给出一个「游戏状态」并选择「胜率最高的下一步」。在本文中,我会试图解释蒙特卡洛树搜索的大多数细节,其中我们也会不时回顾 AlphaGo/Zero,并试图解释那些在 DeepMind AI 程序系列中使用的 MCTS 变体。
蒙特卡洛树搜索是由前里尔第三大学助理教授 Rémi Coulom 在围棋程序 Crazy Stone 中首先引入的方法——后者是第一个在围棋上达到职业五段水平的计算机程序。
从最直观的角度来看,蒙特卡洛树搜索有一个主要目的:给出一个「游戏状态」并选择「胜率最高的下一步」。在本文中,我会试图解释蒙特卡洛树搜索的大多数细节,其中我们也会不时回顾 AlphaGo/Zero,并试图解释那些在 DeepMind AI 程序系列中使用的 MCTS 变体。