关于深度强化学习框架的选择

  入门深度强化学习之后,如何学习经典论文的代码是一个问题。一方面可以通过github上搜索解决这个问题,但质量参差不齐,尝试之后无法跑通会浪费大量时间;另一方面许多优秀的团队开发了深度强化学习的开源框架,结合文档,可以很快上手,阅读源码也可以学习优秀的代码风格。
  我也面临学习强化学习算法代码的问题。今天看到一篇分析各种强化学习框架的文章(该文章发布于2019年):A Comparison of Reinforcement Learning Frameworks: Dopamine, RLLib, Keras-RL, Coach, TRFL, Tensorforce, Coach and More。该文章从模块性、易用性等方面分析了各种强化学习框架的优劣。为了节省时间,文章里面经过一番对比之后,认为Coach是最好的框架,该框架内容全面基本覆盖了强化学习的经典算法和强化学习的各种环境,贴图:
该框架包含的算法
在这里插入图片描述
  可以说是我目前见到过的最全面的框架。
  该框架支持tensorflow和mxnet,有详细的文档以及教程,有良好的模块性并且拥有自己的展示面板(别的框架都基于tensorboard)。该框架的最新版本1.0.0发布于2019年7月24日。
  除了Coach,我还想推荐的一个是Spining Up,这个框架主要实现的是基于policy的算法,并不全面。但它的文档里总结的强化学习经典论文的阅读列表以及如何成为一个深度强化学习研究者,我认为对于深度强化学习的整体把握也是有很大帮助的。
  小伙伴们如果还知道到更好的学习资料,欢迎在评论区留言!
在这里插入图片描述

  • 4
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值