7月16日论文推荐;以及求助RL论文

说句实话,今天两个小时就看了三篇论文。一个小时看的是摘要,还有一个小时看得是数学推导。我个人对研究一点感觉都没有,所以说了千万各位老大不要拍我,但是感觉目前RL,尤其是DeepMind的研究越来越从实用算法比较进入到数学推导了。并不是说数学推导不好,但是作为一个没有追求的人,的确是想看看RL算法当中一些实用的内容。

On The Effect of Auxiliary Tasks on Representation Dynamics的思路还是很清奇的。从整体来说,这篇文章主要考虑的是从数学角度看Auxiliary Task的作用。大体结论是,很多Auxilliary Task和一些数学形式是有所等价的,根据这些理论可以选出来一些问题解决,比如说Sparse Reward的问题。

Accelerated Forward-Backward Optimization using Deep Learning就更偏理论一些。整体来说,这篇文章的套路就是一大堆数学推导里面扔个深度学习网络。理论上来说的确挺有意思的,尤其是对Proximal Methods感兴趣的同学可以看看。

最后一篇就比较老了,Learning by playing solving sparse reward tasks from scratch基本上说的还是多任务学习,这里面比较有意思的还是怎么选任务。从算法角度,作者给出了一些方法,但是从实践角度,似乎还得自己设计。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值