AlphaGo家族如虎添翼,新增成员“AlphaGo Zero”
先前版本的AlphaGo通过结合数百万人类专家的签名和强化学习的监督学习进行自我训练。但是,AlphaGoZero在击败AlphaGo的专业大师之前,它已经接受了几个月的培训,依靠多台机器和48个热塑性聚氨酯AlphaGo Zero的功能在此基础上得到了质的改进。最大的区别是它不再需要人类数据。换句话说,它一开始并没有接触到人类的国际象棋。研发团队只需让它在棋盘上自由移动,然后玩自己的游戏。值得一...
原创
2018-03-13 15:35:31 ·
349 阅读 ·
0 评论