原文链接: dqn 打砖块 Env 对原始gym的Env进行包装
上一篇: fast style transfer 快速风格转换 导出视频
下一篇: dqn 打砖块 model Dueling 网络结构
游戏结束后的负反馈值的大小很影响网络收敛...目前发现设置为-2效果比较好,-1难收敛,-3直接会train不了....
对输入图像进行处理剪裁,去除了计分板和边界等多余东西,相当于减少噪声输入
import numpy as np
import gym
import cv2 as cv
import matplotlib.pyplot as plt
# 输入必须是多副图像,因为单张图像无法获取到小球的速度信息!