NIPS 2017 | 线上分享第一期:似自然梯度的优化算法KFAC与强化学习算法ACKTR


上周我们发布了《攻略 | 虽然票早已被抢光,你可以从机器之心关注 NIPS 2017》,在 NIPS 2017 正式开始前,我们将选出数篇优质论文,邀请论文作者来做线上分享,聊聊理论、技术和研究方法。


所以,第一期分享来了。


北京时间 11 月 8 日 20:00 至 21:00,多伦多大学在读三年级博士生 Yuhuai Wu(吴宇怀)将为大家分享一篇 NIPS 2017 论文《Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation》。



分享者简介


Yuhuai Wu(吴宇怀),多伦多大学在读三年级博士生,师从 Roger Grosse。曾在 Geoffrey Hinton、Yoshua Bengio、Ruslan Salakhutdinov 等指导下做研究。主要研究方向是优化算法、强化学习。是 2017 年 Google fellowship in machine learning 的得主之一。2017 暑假于 OpenAI 做实习,开源了 ACKTR 算法。



演讲主题


这次演讲主要研讨一个最近研发的似自然梯度的优化算法 -- KFAC(似二阶算法)。我们将其用在强化学习的问题上,并提出了新的强化学习算法 -- ACKTR,发现比前人的算法有效 2-3 倍。


针对这篇论文,机器之心曾发布过一篇简介:《OpenAI 开源算法 ACKTR 与 A2C:把可扩展的自然梯度应用到强化学习》,请大家做课前预习。


参与方式


线上分享将在「NIPS 2017 机器之心官方学霸群」中进行。加群方式:长按扫描下方二维码,添加「机器之心小助手Ⅱ」,备注暗号:147,由小助手拉大家入群。



「阅读原文」,查看机器之心 NIPS 2017 专题策划并参与其中。


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值