一些深度强化学习相关的开源库和学习资料

为了回答深度强化学习实验室论坛的问题,按照自己的github梳理了关注的一些开源库:

深度强化学习实验室自己的官方资料汇总链接,感觉还是很好用的:
https://github.com/NeuronDance/DeepRL

基于torch的单强化学习开源库,里面用面向对象的方法封装了几乎所有主流的单智能体强化学习pytorch实现:
https://github.com/p-christ/Deep-Reinforcement-Learning-Algorithms-with-PyTorch

基于torch的多智能体强化学习开源库,用星际争霸案例对State of the art的MARL算法进行了实现:
https://github.com/starry-sky6688/StarCraft

分布式强化学习开源库ray:
https://github.com/ray-project/ray

基于torch的另外几个单强化学习开源库,个人觉得都没有上面第二个推荐那个torch的好用,但是也为一些算法的复现提供了不错的思路:
https://github.com/p-christ/Deep-Reinforcement-Learning-Algorithms-with-PyTorch
https://github.com/sweetice/Deep-reinforcement-learning-with-pytorch
https://github.com/astooke/rlpyt

一个国内团队开发的强化学习算法开发框架库ElegantRl,主打轻量化、稳定、高效开发:
https://github.com/AI4Finance-LLC/ElegantRL
(附上知乎的介绍链接:https://zhuanlan.zhihu.com/p/127792558)

OpenAI开发的一个多智能体混合合作竞争的环境库,当时为了验证MADDPG算法,后来也用于其他多智能体强化算法的验证:
https://github.com/openai/multiagent-particle-envs
(附上对于环境的一个中文博客介绍:https://blog.csdn.net/weixin_43483381/article/details/114240352?spm=1001.2014.3001.5501

多智能体强化学习竞争合作关系下的算法开创,MADDPG,openAI组织的,开源代码:
https://github.com/starry-sky6688/MADDPG

一个初级的多智能体强化学习算法框架库,不如上边推荐那个好用,但是可以参考:
https://github.com/oxwhirl/pymarl

多智能体强化学习算法的一个可视化环境,也是OpenAI那个强化学习seek and hide视频用的环境:
https://github.com/openai/multi-agent-emergence-environments
(附上seek and hide视频链接,用的MADDPG控制:https://www.bilibili.com/video/BV17e411x7sh)

一位本科上交研究生出国的学长的总结的MARL相关的论文,当时看了受益很大:
https://github.com/LantaoYu/MARL-Paper

教学视频的话几个推荐:
1)国产李宏毅老师的强化学习教学,里面对Policy-based的讲解尤其清晰:
https://www.bilibili.com/video/BV124411S7au

2)斯坦福的CS234课程,当时博一上课的时候老师推荐的,里面对于RL怎么来的讲的尤其清晰:
https://www.bilibili.com/video/BV1Cc411h7QQ

3)之前从外网看到的wangshusen老师的视频,感觉也很清晰,其课程ppt和视频都在下面的链接里:
https://github.com/wangshusen/DRL

4)莫烦的python强化学习视频,视频做的很生动有趣:
https://www.bilibili.com/video/BV13W411Y75P?from=search&seid=14400823287014350597

5)最后推荐一个小的但是很有意思的视频,讲神经网络反向传播的,生动形象:
https://www.bilibili.com/video/BV16x411V7Qg

  • 1
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值