报名 | AlphaGo Zero是如何实现无师自通的？

最新推荐文章于 2020-11-06 15:36:33 发布

PaperWeekly

最新推荐文章于 2020-11-06 15:36:33 发布

阅读量373

点赞数

「论文共读」是由 PaperWeekly 发起的协同阅读小组。我们每周精选一篇优质好文，由学术大咖带大家解读论文并展开讨论，在碎片化时代坚持深度阅读。

Google DeepMind 团队在 Nature 上发表的最新论文，阐述了新版 AlphaGo 是如何从空白状态学起，不使用任何人类棋谱，通过自对弈强化学习，仅用 3 天训练时间就以 100:0 击败了上一版本的 AlphaGo，并用 21 天达到 AlphaGo Master 水平。

AlphaGo Zero 的核心在于强化学习下的自我博弈。本期论文共读，我们邀请到深入浅出看懂AlphaGo Zero 一文的作者，圣何塞州立大学研究生刘遥行，带大家揭秘 AlphaGo 的前世今生。

论文介绍

Mastering the Game of Go without Human Knowledge

@PaperWeekly 推荐

#Deep Reinforcement Learning

DeepMind 最新成果，无师自通下围棋。

论文链接

http://www.paperweekly.site/papers/942

嘉宾介绍

刘遥行，圣何塞州立大学研究生，幕布（mubu.com）实习生，关注人工智能和现实生活的工业结合、人工智能和区块链技术的联合应用。

论文共读

AlphaGo Zero是如何实现无师自通的？

AlphaGo Zero

论文解读√在线讨论√

活动形式：语音直播

活动时间

10 月 29 日（周日）13:00-14:15

45 min 串讲 + 30 min 讨论

*请在活动开始前完成论文精读

长按识别二维码，马上报名

*报名成功后，关注系统弹出的公众号获取活动提醒

往期回顾

“阳奉阴违”的半监督学习算法 - Virtual Adversarial Training

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 进行报名

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
报名 | AlphaGo Zero是如何实现无师自通的？

「论文共读」是由 PaperWeekly 发起的协同阅读小组。我们每周精选一篇优质好文，由学术大咖带大家解读论文并展开讨论，在碎片化时代坚持深度阅读。Google DeepMind 团队在 Nature 上发表的最新论文，阐述了新版 AlphaGo 是如何从空白状态学起，不使用任何人类棋谱，通过自对弈强化学习，仅用 3 天训练时间就以 100:0 击败了上一版本的 AlphaGo，并用
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。