AlphaGo Zero,造神还是开启潘多拉魔盒?【附论文下载】

每一个企业级的人 都置顶了 中国软件网

中国软件网 为你带来最新鲜的行业干货



本文作者│欧小刚

微信号│oyg0001

联系邮箱│oxg@soft6.com





近期被一条消息刷屏了——DeepMind 在《自然》杂志上发表了一篇论文,详细介绍了 AlphaGo Zero。AlphaGo Zero是什么来头?它可以无需用大量人类棋谱来进行训练,而是基于最基本的围棋规则来进行自我对抗和自我学习。

本文试图就此展开一些分析和讨论,供大家参考。


1

完爆AlphaGo和Master的AlphaGo Zero到底有多强?

AlphaGo Zero到底有多强?反正是吓到我了。

上线3天后以100:0击败那个因为战胜李世乭而声名在外的AlphaGo Lee;

21天后其技能追平年初横扫国际高手的Master;

40天后以89:11的成绩将Master甩在后面。

AlphaGo Zero上线第1天,能力急剧提升

AlphaGo Zero上线第3天,100:0全胜AlphaGo Lee

AlphaGo Zero上线第21天,追平Master

AlphaGo Zero上线第40天,以89:11战胜Master

这简单的数据背后,蕴含怎样的意义,我想曾败在Master手下的柯洁有更真切的感受。在获知AlphaGo Zero的消息后,他发布了如下的微博:

除了强悍的战斗力外,还有一点值得注意,那就是AlphaGo Zero相比上几个版本,有更高的能效比——最早 AlphaGo Fan(打败了樊麾的版本)使用了176个GPU ,打败李世乭的AlphaGo Lee使用了48个TPU,而AlphaGo Zero只用了4个TPU,是 AlphaGo Lee的8.5%。

不同版本AlphaGo所用到的计算能力

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值