#今日论文推荐# 南大最新综述论文：基于模型的强化学习

最新推荐文章于 2024-10-01 20:17:55 发布

wwwsxn

最新推荐文章于 2024-10-01 20:17:55 发布

阅读量192

点赞数

分类专栏：深度学习文章标签：深度学习计算机视觉人工智能

原文链接：https://www.aminer.cn/research_report/62eb36117cb68b460ffb3cb1

版权

深度学习专栏收录该内容

716 篇文章 30 订阅

订阅专栏

#今日论文推荐# 南大最新综述论文：基于模型的强化学习

强化学习(RL)通过与环境交互的试错过程来解决顺序决策问题。虽然RL在允许大量试错的复杂电子游戏中取得了杰出的成功，但在现实世界中犯错总是不希望的。
为了提高样本效率从而减少误差，基于模型的强化学习（MBRL）被认为是一个有前途的方向，它建立的环境模型中可以进行试错，而不需要实际成本。
本文对MBRL的研究现状进行了综述，并着重介绍了近年来研究的进展。对于非表格环境，学习到的环境模型与实际环境之间存在泛化误差。因此，分析环境模型中策略训练与实际环境中策略训练的差异，对算法设计、模型使用和策略训练具有重要的指导意义。
此外，我们还讨论了离线在线学习、目标条件在线学习、多智能体在线学习和元在线学习等基于模型的在线学习技术的最新进展，以及MBRL在实际任务中的适用性和优势。
最后，我们讨论了MBRL未来的发展前景。我们认为MBRL在实际应用中具有巨大的潜力和优势，但这些优势往往被忽视，希望本文的综述能够吸引更多关于MBRL的研究。

论文题目：A Survey on Model-based Reinforcement Learning
详细解读：https://www.aminer.cn/research_report/62eb36117cb68b460ffb3cb1https://www.aminer.cn/research_report/62eb36117cb68b460ffb3cb1
AMiner链接：https://www.aminer.cn/?f=cs

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。