强化学习 pysc2学习笔记
env
pysc2配置启动和嵌入算法所需的基本信息。
主要包括地图名、screen、minimap的像素信息,训练的最大帧数与回合数,SC2与程序交互信息,agent的动作空间和状态空间等。
实际使用研究时可通过env.observation_spec(),env.action_spec()导入。这里主要写训练常用的obs和action。
obs与action
下面是进行一定修改的pysc2自带run_loop模块的部分,可以通过这里创建简单的训练循环,这里通过此文件说明agent的基本信息。
observation_spec = env.observation_spec()
action_spec = env.action_spec()
#这里引入pysc2库的env