2019年11月_及达尖犁头鳐

12月 11月 09月

原创《白话强化学习与PyTorch》学习笔记---第八章

《白话强化学习与PyTorch》学习笔记-第八章第八章用了DQN及各种改进算法来训练Gym中的atari游戏—pong首先先来看一下官方网站中的游戏介绍：简单来说，训练目的是使得分最大化。在这个环境中的观察结果(observation)是RGB图像，大小为（210，160，3），在2~4（随机采样）帧内重复同一个动作。从环境中得到observation后，我们会先对数据进行预处理操作：d...

2019-11-11 12:06:21 4135 19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 《白话强化学习与PyTorch》学习笔记---第八章

空空如也

空空如也

原创《白话强化学习与PyTorch》学习笔记---第八章