欢迎使用CSDN-markdown编辑器

最新推荐文章于 2021-05-04 09:25:46 发布

nalanyu2000

最新推荐文章于 2021-05-04 09:25:46 发布

阅读量139

点赞数

分类专栏：机器学习文章标签：算法

本文链接：https://blog.csdn.net/nalanyu2000/article/details/76642329

版权

6 篇文章 0 订阅

订阅专栏

Monte Carlo Tree Search

围棋的空间太大，很难用树形结构全部罗列展开，比如MinMax，所以用Monte Carlo Tree Search 对某个节点之后的情况进行随机模拟

这里写图片描述

这个是著名的老虎机问题

这里写图片描述

xi代表玩第i台老虎机平均赢到的钱，后面根式里的表达式让算法有机会去尝试其他机器。如果一直玩同一台机器的话，n和ni都都会变大，根式里面会变小。对于其他机器来说n变大因为没有玩，ni不变，所以整体就会变大，所以程序就会跳去玩其他机器。

这里写图片描述

这里是利用CNN来训练网络下围棋的示意图

训练CNN下围棋

关注

专栏目录