![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
PyTorch
YTIANYE
这个作者很懒,什么都没留下…
展开
-
强化学习DQN实践——CartPole-v0完整代码分析+详细注释
介绍使用PyTorch从OpenAI Gym中的 CartPole-v0 任务上训练一个Deep Q LearningAgent 必须在两个动作之间做出决定 - 向左或向右移动推车 - 以使连接到它的杆保持直立。分析过程https://pytorch123.com/SeventhSection/ReinforcementLearning/完整代码+详细注释"""1. 需要的包"""import gymimport mathimport randomimport n原创 2021-04-13 21:49:19 · 9379 阅读 · 6 评论 -
Gym基本操作
使用流程1. 加载 gym 库:import gym2. 进入指定的实验环境:env = gym.make("Taxi-v2").env3. 渲染环境,即可视化看看环境的样子:env.render()其中 env 是 gym 的核心接口常用方法1. env.reset, 重置环境,返回一个随机的初始状态。2. env.step(action),将选择的action输入给env,env 按照这个动作走一步进入下一个状态,所以它的返回值有四个:observation:转载 2021-04-13 21:16:10 · 1422 阅读 · 0 评论 -
图像预处理转化为Tensor后的unsqueeze(0)
unsqueeze()这个函数主要是对数据维度进行扩充。给指定位置加上维数为一的维度,比如原本有个三行的数据(3),unsqueeze(0)后就会在0的位置加了一维就变成一行三列(1,3)。torch.squeeze(input, dim=None, out=None):去除那些维度大小为1的维度torch.unbind(tensor, dim=0):去除某个维度torch.unsqueeze(input, dim, out=None):在指定位置添加维度。unsqueeze主要起到升维的作转载 2021-04-12 22:24:26 · 6085 阅读 · 0 评论