【重磅】Tensorflow2.0实现29种深度强化学习算法大汇总

点击上方,选择星标置顶,不定期资源大放送

阅读大概需要3分钟

Follow小博主,每天更新前沿干货

来源:深度强化学习实验室

作者:王健树

【导读】今天给大家推荐一个超赞的强化学习项目资料,该项目作者使用gym,Unity3D ml-agents等环境,利用tensorflow2.0版本对29种算法进行了实现的深度强化学习训练框架,该框架具有如下特性:

  • 实现单智能体强化学习、分层强化学习、多智能体强化学习算法等约29种

  •  适配gym、MuJoCo、PyBullet、Unity ML-Agents等多种训练环境

  • 支持多向量信息、多图像信息同时输入

  • 实现多种高性能经验池,如并行PER、episode replay buffer

  • 跨平台支持Windows、Linux、OSX三种操作系统

  • 实现Noisy Net、ICM等多种探索机制

下面是具体算法执行列表。


传送门:https://github.com/StepNeverStop/RLs


推荐阅读

(点击标题可跳转阅读)

重磅!DLer-强化学习交流群已成立!

欢迎各位RLer加入强化学习微信交流大群,本群旨在交流强化学习框架、策略梯度、DQN、理论推导与算法实现、前沿技术与顶会文章解读、应用场景等内容。更有求职内推、算法竞赛、资源干货、业界前沿资讯等,欢迎加群交流学习!

进群请备注:研究方向+学校/公司+昵称(如强化学习+上交+王明)

广告商、博主请绕道!

???? 长按识别添加,邀请您进群!

  • 0
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值