- 博客(1)
- 收藏
- 关注
原创 《白话强化学习与PyTorch》学习笔记---第八章
《白话强化学习与PyTorch》学习笔记-第八章第八章用了DQN及各种改进算法来训练Gym中的atari游戏—pong首先先来看一下官方网站中的游戏介绍:简单来说,训练目的是使得分最大化。在这个环境中的观察结果(observation)是RGB图像,大小为(210,160,3),在2~4(随机采样)帧内重复同一个动作。从环境中得到observation后,我们会先对数据进行预处理操作:d...
2019-11-11 12:06:21 4135 19
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人