AlphaGo Zero ( 阿尔法元 ) 简介

最新推荐文章于 2023-11-08 21:02:22 发布

VIP文章 MillionBenjamin

最新推荐文章于 2023-11-08 21:02:22 发布

阅读量5.7k

点赞数

文章标签：软件团队

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/MillionBenjamin/article/details/78529756

版权

阿尔法元是Deepmind围棋软件AlphaGo的一个版本。AlphaGo团队于2017年10月19日在“ 自然 ” 杂志上发表了一篇文章，介绍了AlphaGo Zero，这个版本不用学习人类的游戏数据，比之前的版本更强大。AlphaGo Zero 在三天内通过自我对弈拥有了超过了AlphaGo Lee的实力，赢得100比0，在21天内达到了AlphaGo Master的水平，并在40天内超过了所有旧版本。它的学习从零开始，且单纯基于与自己的对弈。人类的输入没有超出游戏规则以外的任何指导、数据以及内部知识。
这里写图片描述

AlphaGo Zero仅用到一张神经网络，这张网络经过训练，专门预测程序自身的棋步和棋局的赢家，在每次自我对弈中进步。新程序只使用一台机器和4个TPU。AI）培养人工智能不从人类专家获得的数据集，对于具有超人技能的AI的发展具有重大意义，因为专家数据通常是昂贵的，不可靠的或不适用于机器的。DeepMind联合创始人兼首席执行官Demis Hassabis表示，AlphaGo Zero功能强大，因为它“不再受人类知识的限制”。
根据Hassabis的说法，AlphaGo的算法可能对于需要通过巨大的可能性空间（如蛋白质折叠或精确模拟化学反应）进行智能搜索的领域最有利。 AlphaGo的技术在难以模拟的领域（例如学习如何驾驶汽车）可能不太有用。

最低0.47元/天解锁文章

MillionBenjamin

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
AlphaGo Zero ( 阿尔法元 ) 简介

阿尔法元是Deepmind围棋软件AlphaGo的一个版本。AlphaGo团队于2017年10月19日在“ 自然 ” 杂志上发表了一篇文章，介绍了AlphaGo Zero，这个版本不用学习人类的游戏数据，比之前的版本更强大。AlphaGo Zero 在三天内通过自我对弈拥有了超过了AlphaGo Lee的实力，赢得100比0，在21天内达到了AlphaGo Master的水平，并在40天内超过了所有
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。