1.3 准备环境
本项目准备环境主要包括安装 stable-baselines3 和 shimmy,其中前者提供强化学习算法,后者用于简化环境兼容性。另外,还需要还导入处理数据、科学计算及环境包装所需的库。
1.3.1 安装stable-baselines3
本项目基于stable-baselines3实现,这是一个用于强化学习的开源 Python 库,旨在提供简单、可靠且高效的强化学习算法实现。stable-baselines3是 stable-baselines 的继任者,提供了一些流行的强化学习算法的最新实现,支持多个强化学习环境和任务。使用如下命令安装stable-baselines3,
pip install stable-baselines3
1.3.2 安装shimmy
shimmy 是一个 Python 库,旨在简化强化学习(RL&#