读文章:Revisiting Bellman Errors for Offline Model Selection
*Offline reinforcement learning (ORL)离线强化学习:**与在线强化学习相对的一个概念,ORL有固定的数据集,数据是从静态数据集获取的;在线强化学习与环境有交互演进,数据是动态的从环境获取的。**优点:**由于不需要和环境实时交互,ORL为研究的经济性和安全性提供了保障,在自动驾驶、健康医疗等领域中可以使用。
翻译
2023-02-06 12:27:17 ·
58 阅读 ·
1 评论