【强化学习】MCTS: 蒙特卡洛树搜索
Monte-Carle 树搜索是一种前向搜索(Forward Search)用的是基于采样的模型可以先看一下下文中的一个例子,mini-max搜索是一种传统的博弈树算法,在国际象棋中获得了比较好的应用。但是需要遍历整个游戏树,对于棋格树多许多的围棋,构建完整的游戏树代价是十分昂贵的。28 天自制你的 AlphaGo (6) : 蒙特卡洛树搜索(MCTS)基础选择 Selection:从根节点 R 开始,递归选择最优的子节点(后面会解释)直到达到叶子节点 L。扩展 Expans.





