模仿AlphaGo围棋博弈,MuGo实现策略网络以及蒙特卡洛树搜索
AlphaGo数次击败了人类围棋高手,大家是不是摩拳擦掌,想对Alphago一探究竟。 网友brliee的作品MuGO实现了AlphaGo的策略网络(policy)和蒙塔卡罗树搜索(mcts)两大主要策略,并且能够训练自己的深度神经网络,可视化在线对弈。本文即是MuGo的实现过程。 MuGo标题镇楼: 本文实现环境:ubuntu14.04Python 3.5.2 |Anaconda cus
原创
2017-08-10 22:54:22 ·
5731 阅读 ·
11 评论