NIPS 2017 | 线上分享第一期：似自然梯度的优化算法KFAC与强化学习算法ACKTR

最新推荐文章于 2024-01-31 17:08:11 发布

PaperWeekly

最新推荐文章于 2024-01-31 17:08:11 发布

阅读量2.6k

点赞数

上周我们发布了《攻略 | 虽然票早已被抢光，你可以从机器之心关注 NIPS 2017》，在 NIPS 2017 正式开始前，我们将选出数篇优质论文，邀请论文作者来做线上分享，聊聊理论、技术和研究方法。

所以，第一期分享来了。

北京时间 11 月 8 日 20:00 至 21:00，多伦多大学在读三年级博士生 Yuhuai Wu（吴宇怀）将为大家分享一篇 NIPS 2017 论文《Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation》。

分享者简介

Yuhuai Wu（吴宇怀），多伦多大学在读三年级博士生，师从 Roger Grosse。曾在 Geoffrey Hinton、Yoshua Bengio、Ruslan Salakhutdinov 等指导下做研究。主要研究方向是优化算法、强化学习。是 2017 年 Google fellowship in machine learning 的得主之一。2017 暑假于 OpenAI 做实习，开源了 ACKTR 算法。

演讲主题

这次演讲主要研讨一个最近研发的似自然梯度的优化算法 -- KFAC（似二阶算法）。我们将其用在强化学习的问题上，并提出了新的强化学习算法 -- ACKTR，发现比前人的算法有效 2-3 倍。

针对这篇论文，机器之心曾发布过一篇简介：《OpenAI 开源算法 ACKTR 与 A2C：把可扩展的自然梯度应用到强化学习》，请大家做课前预习。

参与方式

线上分享将在「NIPS 2017 机器之心官方学霸群」中进行。加群方式：长按扫描下方二维码，添加「机器之心小助手Ⅱ」，备注暗号：147，由小助手拉大家入群。

戳「阅读原文」，查看机器之心 NIPS 2017 专题策划并参与其中。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。