强化学习
文章平均质量分 58
gsgbgxp
这个作者很懒,什么都没留下…
展开
-
pytorch中的gather函数
在学习强化学习的过程中,有时需要将理解pytorch几个高级选择函数(如gather)https://www.cnblogs.com/liangjianli/p/13754817.html#3-gather%E5%87%BD%E6%95%B0gather函数pytorch和numpy中许多函数都涉及维度运算,gather也不例外,但是它相对于其他函数更难理解。依然先来看一个例子import torcha = torch.arange(1, 16).reshape(5, 3)“”"result原创 2021-02-14 16:43:42 · 7696 阅读 · 1 评论 -
gym中env的unwrapped
在看一些示例程序代码时,一般从gym中引用环境只需要用gym.make就可以了,比如env=gym.make('CartPole-v0')但在很多程序中(如莫烦pytorch的DQN程序),还有这样一句env = env.unwrapped关于这个unwrapped的含义,文章gym中env的unwrapped中是这么解释的:Open AI gym提供了许多不同的环境。每一个环境都有一套自己的参数和方法。然而,他们通常由一个类Env包装(就像这是面向对象编程语言(OOPLs)的一个接口)。这原创 2021-02-10 12:31:12 · 1919 阅读 · 0 评论 -
强化学习环境配置Ubuntu18.04
最近开始学习强化学习,要配置相关环境。主要涉及到gym、mujoco、baselines。最开始的时候发现想要完整安装gym就得安装mujoco,而mujoco又不是免费的,还得申请什么的,感觉太麻烦了,就暂时选择了gym的最小安装。后来学习到DQN时发现要用到baselines,但用pip直接安装时却提示了和mujoco相关的错误。然后选择了下面这篇文章的方法【强化学习】gym+baselines+mujoco+mujoco_py安装配置进入虚拟环境,用git直接克隆conda activat原创 2021-02-09 15:47:12 · 983 阅读 · 0 评论