前言:
由于项目需要,需要了解U3D的ML-Agents插件。预期目的有几点:
- ML-Agents的大致框架
- 各个部分的具体实现细节
在开始研究前,首先我要搭建实验环境,之后运行官方案例。
大致框架:
ML-Agents是一个Unity3D的插件,其包含3个高级组件:学习环境,External Communicator,Python API。
- 学习环境:就是代理存在,并生活的地方。它可以小到是几个简单对象组成的模拟场景,大到可以是一个复杂场景的模拟。
- Python API - 其中包含用于训练(学习某个行为或 policy)的 所有机器学习算法。请注意, 与学习环境不同,Python API 不是 Unity 的一部分,而是位于外部,并通过 External Communicator 与 Unity 进行通信。(ml-agents-master 中 ml-agents 就包含所有的策略算法)
- External Communicator:它将 Unity 环境与 Python API 连接起来。它位于 Unit