DRL前沿之：Benchmarking Deep Reinforcement Learning for Continuous Control

最新推荐文章于 2021-12-03 17:40:01 发布

songrotek

最新推荐文章于 2021-12-03 17:40:01 发布

阅读量6.8k

点赞数 1

分类专栏： Deep Reinforcement Learning 深度增强学习DRL 文章标签：深度学习机器人神经网络 DRL

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/songrotek/article/details/51261750

版权

本文介绍了深度强化学习（DRL）在连续控制领域的基准测试，通过开源软件包对比了不同算法在31种任务上的表现。研究发现，TNPG和TRPO算法效果最佳，其次是DDPG。该基准对于DRL研究具有重要意义，推动了新算法的发展。

摘要由CSDN通过智能技术生成

1 前言

Deep Reinforcement Learning可以说是当前深度学习领域最前沿的研究方向，研究的目标即让机器人具备决策及运动控制能力。话说人类创造的机器灵活性还远远低于某些低等生物，比如蜜蜂。。DRL就是要干这个事，而是关键是使用神经网络来进行决策控制。

因此，考虑了一下，决定推出DRL前沿系列，第一时间推送了解到的DRL前沿，主要是介绍最新的研究成果，不讲解具体方法（考虑到博主本人也没办法那么快搞懂）。也因此，本文对于完全不了解这个领域，或者对这个领域感兴趣的童鞋都适合阅读。

下面进入正题。

2 Benchmarking Deep Reinforcement Learning for Continuous Control

文章出处：http://arxiv.org/abs/1604.06778
时间：2016年4月25日
开源软件地址：https://github.com/rllab/rllab

这篇文章不是什么创新算法的文章，但却是极其重要的一篇文章，看到文章的第一眼就能看出来。这篇文章针对DRL在连续控制领域的问题弄了一个Benchmark，而且，关键是作者把程序开源了，按照作者的原话就是

To encourage adoption by other researchers!

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。