ELF OpenGo模型自我特训2,000万场释出研究成果

社群去年开源了能完败职业围棋高手的人工智能ELF OpenGo,现在更进一步开源经两千万次自我对战的模型与数据集等相关研究成果。ELF OpenGo的前身原为DeepMind开发的围棋软件AlphaGo Zero,社群将其重新实作发布ELF OpenGo,能以一颗GPU就打赢排名前30的4位围棋高手,还是皆以20比0完胜。ELF是社群在2017年发布的游戏研究平台,讲究可扩充、轻量与灵活的特性,ELF让研究人员能在各种游戏环境中测试算法,包括棋盘、街机与实时战略游戏,而在2018年,社群开源了基于ELF平台的OpenGo。现在社群进一步释出ELF OpenGo相关的新功能和研究成果,开源经过2千万次人工智能自我对战训练的模型。社群提到,由于训练模型需要有大量的计算资源,因此即便他们在2018年释出ELF OpenGo到原始码,但多数研究人员仍无法重现社群的研究成果。所以社群决定从头训练开始训练ELF OpenGo,并释出其所有的研究成果,对外公开人工智能能够打败玩家的原因,同时也详述了技术的局限,社群特别举例,人工智能在学习招式的速度比人类慢得多,像是下图的梯子招式,人工智能就花了很多时间才学到。

社群开源的ELF OpenGo是目前最新的模型以及最佳程序代码版本,包括2千万次自我对战的模型以及1,500个中介模型数据。社群还以模型分析职业围棋棋士的赛局,发现模型的预测能力,约在总训练时间的10%就已经达到稳定水平,并随着训

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值