ELF OpenGo模型自我特训2,000万场释出研究成果

最新推荐文章于 2024-05-11 09:58:31 发布

SBFPLAY561

最新推荐文章于 2024-05-11 09:58:31 发布

阅读量457

点赞数

文章标签： ELF OpenGo 自我特训人工智能 AI 研究成果

本文链接：https://blog.csdn.net/SBFPLAY561/article/details/87713711

版权

ELF OpenGo，源自DeepMind的AlphaGo Zero，已在社群开源并进行两千万次自我对战训练。新模型不仅提升了围棋实力，还能以60%以上胜率战胜早期版本。此开源项目包含历史赛局数据、中介模型，为AI研究和围棋训练提供宝贵资源。

摘要由CSDN通过智能技术生成

社群去年开源了能完败职业围棋高手的人工智能ELF OpenGo，现在更进一步开源经两千万次自我对战的模型与数据集等相关研究成果。ELF OpenGo的前身原为DeepMind开发的围棋软件AlphaGo Zero，社群将其重新实作发布ELF OpenGo，能以一颗GPU就打赢排名前30的4位围棋高手，还是皆以20比0完胜。ELF是社群在2017年发布的游戏研究平台，讲究可扩充、轻量与灵活的特性，ELF让研究人员能在各种游戏环境中测试算法，包括棋盘、街机与实时战略游戏，而在2018年，社群开源了基于ELF平台的OpenGo。现在社群进一步释出ELF OpenGo相关的新功能和研究成果，开源经过2千万次人工智能自我对战训练的模型。社群提到，由于训练模型需要有大量的计算资源，因此即便他们在2018年释出ELF OpenGo到原始码，但多数研究人员仍无法重现社群的研究成果。所以社群决定从头训练开始训练ELF OpenGo，并释出其所有的研究成果，对外公开人工智能能够打败玩家的原因，同时也详述了技术的局限，社群特别举例，人工智能在学习招式的速度比人类慢得多，像是下图的梯子招式，人工智能就花了很多时间才学到。