如题,首先定义gym的环境,这里使用breakout游戏。可以输出该环境的观测空间、动作空间,以及每个动作代表的意义
ENV = 'Breakout-v0'
env = gym.make(ENV)
print(env.observation_space)
print(env.action_space)
print(env.unwrapped.get_action_meanings())
输出为
Box(0, 255, (210, 160, 3), uint8)
Discrete(4)
['NOOP', 'FIRE', 'RIGHT', 'LEFT']
接下来是运行环境并显示,代码如下:
import numpy as np
import cv2
import time
import gym
import matplotlib