Background-PyTorch 【ML-Agents 官方文档翻译（ML-Agent 1.9.1，Unity 2018-2020）】

最新推荐文章于 2024-02-23 12:56:14 发布

FutaAlice

最新推荐文章于 2024-02-23 12:56:14 发布

阅读量2.5k

点赞数

分类专栏： ML-Agents Unity 文章标签： unity 游戏引擎强化学习

本文链接：https://blog.csdn.net/u014755412/article/details/121410808

版权

Unity 同时被 2 个专栏收录

9 篇文章

订阅专栏

ML-Agents

8 篇文章

订阅专栏

本文介绍了PyTorch——一个基于数据流图的开源深度学习库，及其在ML-Agents Toolkit中的作用。此外，还讨论了如何利用TensorBoard这一可视化工具来优化超参数，从而提高训练效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Background: PyTorch

正如我们在 Background-Machine Learning 中所讨论的，
ML-Agents Toolkit 中提供的许多算法都基于深度学习。
更确切地说，ML-Agent Toolkit 的实现基于开源库 PyTorch。
在本节中，我们将简要介绍我们在 ML-Agents Toolkit 中所使用的 PyTorch 和 TensorBoard。

PyTorch

PyTorch 是一个开源库，用于使用 Data Flow Graphs（数据流图，深度学习模型的底层表示）执行计算。
它可以在 CPU 和 GPU 上的训练和推理，适用于包括桌面端、服务器、移动端等各种设备。
使用 ML-Agents Toolkit 训练 Agent，将输出一个可以与 Agent 关联的模型（.onnx）文件。
除非你需要实现一个新的算法，否则对于 PyTorch 的调用大多是间接的，并且在幕后进行。

TensorBoard

使用 PyTorch 训练模型时需要设置模型的一些属性（被称为超参数，Hyperparameters）
为这些 Hyperparameters 找到合适的值可能需要数次迭代。因此，我们常使用一个名为 TensorBoard 的可视化工具。
TensorBoard 可以在训练过程中可视化 Agent 的某些属性（例如 Reward），这有助于直观的了解不同的超参数的区别，并针对当前 Unity Environment 优化调整这些值。
关于如何设置 Hyperparameters，我们在 Training ML-Agents 页面提供更加详细的介绍。
如果对于 TensorBoard 不熟悉，我们推荐阅读 using TensorBoard with ML-Agents 或者这个第三方教程。