想象一下,您有兴趣使用强化学习解决某个问题。您已在您的环境中编写代码,并编制了一份强化学习 (RL) 算法清单以供尝试。从头开始自行实现算法既棘手又耗时,因为它需要大量试验并包含许多实现技巧。所以你会怎么做?
最好的答案是使用 RL 框架。RL 框架包含 RL 算法的近乎最优的实现。算法的实现被卸载到框架中,用户只需要担心演员和评论家模型的神经架构。有很多基于 TensorFlow 和 PyTorch 的框架。然而,与 MATLAB 2021a 一起发布的强化学习设计器应用程序也是这一类别的有力竞争者,本文就是关于这一点的。
RL Designer 应用程序是强化学习工具箱的一部分。它基本上是 RL 工具箱功能的前端。设计器的指向和单击方面使管理 RL 工作流变得极其容易,在本文中,我将描述如何使用该应用程序解决简单的 OpenAI 环境。
RL 设计器应用程序看起来有点类似于深度网络设计器应用程序。在左窗格中,您可以找到代理、环境、结果和环境详细信息。您可以在应用程序本身内执行整个 RL 工作流程。由于我们想让事情变得有点挑战,我们将首先演示如何在外部环境中加载并使用我们的自定义网络在其上训练 DQN。