AlphaGo Zero ( 阿尔法元 ) 简介

阿尔法元是Deepmind围棋软件AlphaGo的一个版本。AlphaGo团队于2017年10月19日在“ 自然 ” 杂志上发表了一篇文章,介绍了AlphaGo Zero,这个版本不用学习人类的游戏数据,比之前的版本更强大。AlphaGo Zero 在三天内通过自我对弈拥有了超过了AlphaGo Lee的实力,赢得100比0,在21天内达到了AlphaGo Master的水平,并在40天内超过了所有旧版本。它的学习从零开始,且单纯基于与自己的对弈。人类的输入没有超出游戏规则以外的任何指导、数据以及内部知识。
这里写图片描述

AlphaGo Zero仅用到一张神经网络,这张网络经过训练,专门预测程序自身的棋步和棋局的赢家,在每次自我对弈中进步。新程序只使用一台机器和4个TPU。AI)培养人工智能不从人类专家获得的数据集,对于具有超人技能的AI的发展具有重大意义,因为专家数据通常是昂贵的,不可靠的或不适用于机器的。DeepMind联合创始人兼首席执行官Demis Hassabis表示,AlphaGo Zero功能强大,因为它“不再受人类知识的限制”。
根据Hassabis的说法,AlphaGo的算法可能对于需要通过巨大的可能性空间(如蛋白质折叠或精确模拟化学反应)进行智能搜索的领域最有利。 AlphaGo的技术在难以模拟的领域(例如学习如何驾驶汽车)可能不太有用。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值