每一个企业级的人 都置顶了 中国软件网
中国软件网 为你带来最新鲜的行业干货
本文作者│欧小刚
微信号│oyg0001
联系邮箱│oxg@soft6.com
近期被一条消息刷屏了——DeepMind 在《自然》杂志上发表了一篇论文,详细介绍了 AlphaGo Zero。AlphaGo Zero是什么来头?它可以无需用大量人类棋谱来进行训练,而是基于最基本的围棋规则来进行自我对抗和自我学习。
本文试图就此展开一些分析和讨论,供大家参考。
1
完爆AlphaGo和Master的AlphaGo Zero到底有多强?
AlphaGo Zero到底有多强?反正是吓到我了。
上线3天后以100:0击败那个因为战胜李世乭而声名在外的AlphaGo Lee;
21天后其技能追平年初横扫国际高手的Master;
40天后以89:11的成绩将Master甩在后面。
AlphaGo Zero上线第1天,能力急剧提升
AlphaGo Zero上线第3天,100:0全胜AlphaGo Lee
AlphaGo Zero上线第21天,追平Master
AlphaGo Zero上线第40天,以89:11战胜Master
这简单的数据背后,蕴含怎样的意义,我想曾败在Master手下的柯洁有更真切的感受。在获知AlphaGo Zero的消息后,他发布了如下的微博:
除了强悍的战斗力外,还有一点值得注意,那就是AlphaGo Zero相比上几个版本,有更高的能效比——最早 AlphaGo Fan(打败了樊麾的版本)使用了176个GPU ,打败李世乭的AlphaGo Lee使用了48个TPU,而AlphaGo Zero只用了4个TPU,是 AlphaGo Lee的8.5%。
不同版本AlphaGo所用到的计算能力