Super-mario-bros-PPO-pytorch 项目使用教程
1. 项目的目录结构及介绍
Super-mario-bros-PPO-pytorch/
├── Dockerfile
├── LICENSE
├── README.md
├── infer.py
├── train.py
├── actions.py
├── demo/
│ └── ...
├── output/
│ └── ...
├── src/
│ └── ...
└── trained_models/
└── ...
- Dockerfile: 用于构建Docker镜像的文件。
- LICENSE: 项目的MIT许可证文件。
- README.md: 项目的说明文档。
- infer.py: 用于预测的脚本。
- train.py: 用于训练模型的脚本。
- actions.py: 定义游戏动作的脚本。
- demo/: 存放演示文件的目录。
- output/: 存放输出文件的目录。
- src/: 存放源代码的目录。
- trained_models/: 存放训练好的模型文件的目录。
2. 项目的启动文件介绍
train.py
train.py
是用于训练模型的主要脚本。可以通过以下命令启动训练:
python train.py --game=SuperMarioBros-Nes
infer.py
infer.py
是用于预测的脚本,使用训练时保存的最佳得分模型进行预测。可以通过以下命令启动预测:
python infer.py --game=SuperMarioBros-Nes
3. 项目的配置文件介绍
项目中没有显式的配置文件,但可以通过命令行参数进行配置。例如,在训练时可以通过 --game
参数指定游戏名称:
python train.py --game=SuperMarioBros-Nes
在预测时同样可以通过 --game
参数指定游戏名称:
python infer.py --game=SuperMarioBros-Nes
此外,actions.py
文件中定义了游戏可执行的动作,可以根据需要进行修改以适应不同的游戏。