一、资源准备工作
这里使用windows的Anaconda环境测试项目,首先克隆项目,
项目地址:https://github.com/PWhiddy/PokemonRedExperiments?tab=readme-ov-file
下载Pokemon Red ROM
到主文件夹下(也就是PokemonRedExperiments-master
文件夹下)。google上能搜索到,解压后名字改为PokemonRed.gb
.
安装Anaconda(CSND上很多在Windows上安装Anaconda的教程)并创建环境:
conda create -n pokeman python=3.11
二、部署环境测试运行
在Anaconda Prompt中进入我们创建的conda环境
conda activate pokeman
进入baselines文件夹,安装依赖项,这里第一次安装时候报错,所以要先修改requirements.txt文件夹中的mediapy @ git+https://github.com/PWhiddy/mediapy.git@45101800d4f6adeffe814cad93de1db67c1bd614
修改为mediapy
再尝试运行
pip install -r requirements.txt
顺利运行,跑一下预训练模型试试看(在baselines文件夹中):
python run_pretrained_interactive.py
成功运行,使用箭头键以及 a 和 s 键(对应GBA中的A 和 B 按钮)与模拟器进行交互,记得切换美式键盘。 打开agent_enabled.txt
把yes改成no保存,AI就无法控制游戏了,你就可以控制游戏了,在anaconda终端中按ctrl+c就能够停止程序,是不是很有意思啊~
三、训练模型
使用代码:
python run_baseline_parallel_fast.py
来训练模型,使用
tensorboard --logdir=D:\aiproject\PokemonRedExperiments-master\baselines
将路径切换为自己的路径,注意是在baselines文件夹下。然后在浏览器地址栏输入localhost:6006
回车就能够看到训练指标了。
好像还有训练时候的可视化的办法,有空我研究一下~