【2017最佳机器学习论文】AlphaGo Zero最赏心悦目(一文读懂大咖论文)

前几天与杨静老师和刘江老师,讨论 2017 年人工智能进展时,没来得及说 2017 年最值得读的论文。

“什么是最值得读的论文”,这个话题,仁者见仁智者见智。

下面,说说我个人觉得今年收获最大的论文:

最赏心悦目的论文

0023431c8fff80aff49afc46b23829049548f2d2

Mastering the Game of Go without Human Knowledge 是 DeepMind 团队关于 AlphaGo Zero 的论文,发表于 Nature 期刊。

读这篇论文时,要与 DeepMind 先前讲解 AlphaGo 的另一篇论文,对照着读。那一篇论文的题目是,Mastering the Game of Go with Deep Neural Networks and Tree Search

比较这两篇论文,AlphaGo Zero 比先前的版本 AlphaGo 的算法,更精炼,但是功能更强大。而且 AlphaGo Zero 的论文,写得也更精彩。尤其是叙述 AlphaGo Zero 靠自我博弈,花了多少小时,发现了围棋定式。又花了多少天,AlphaGo Zero 棋力先后战胜樊麾和李世乭等等。

048eaf7340c94a941e2f480f65d02a194a3b2930

最有实践价值论文(两篇)

Attention Is All You Need 和 One Model To Learn Them All 这两篇论文,都是 Google Brain 团队的作品,而且都开源了源码,使用非常方便。

5333847eda3d052fde8338a1cb4805dc87920884

One Model to Learn Them All 论文图片

如果说深度学习,尤其是 CNN 的价值,在于用卷积算法,从原始数据中自动提炼特征,而不必像以往那样,靠人工来提炼特征。那么 Attention 的价值,在于对卷积进行反思。卷积不是提炼特征的唯一方法,而且也不一定是最佳方法。Google Brain 团队认为,Attention 在大多数场景下,可能比卷积更有效。

迄今为止,Attention 的算法大多数基于测算线性相似度。相信明年开始,会有更多的研究,着力于改造 Attention 的算法,尝试非线性相似度,甚至超越相似度,寻找更多的聚焦方式。

最有潜力研究方向

ae39c512fae4854ce53d4229d06c663c4854fce2

Superhuman AI for heads-up no-limit poker: Libratus beats top professionals 是 CMU 团队讲述人工智能德扑系统 Libratus 的论文,发表于 Science 期刊。

德扑面临着隐信息和反欺诈两个难题,比围棋更接近于真实世界的博弈。

AlphaGo 用深度强化学习,完美地解决了围棋的问题。接下去的悬念,是深度强化学习能否解决隐信息和反欺诈两个难题。有趣的是,Libratus 没有用深度强化学习,却相当漂亮地解决了这两个难题。明年的悬念是,DeepMind 的同事们,能否用深度强化学习来超越 Libratus?


原文发布时间为:2018-01-02

本文作者:邓侃

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:【2017最佳机器学习论文】AlphaGo Zero最赏心悦目(一文读懂大咖论文)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值