强化学习
彩云的笔记
一起编程去!!
展开
-
maddpg 复现过程中遇到的问题
最后将pytorch降级搞定了,不用改啥代码。将代码中的类型替换后,又出现错误。原创 2023-02-17 16:34:53 · 1261 阅读 · 4 评论 -
论文学习 DQN Nature 2015
今天看了Human-level control through deep reinforcement。卷子核,分别是8*8, 4*4, 3*3。learning和代码。输出维度分别是32,64,64。原创 2023-01-31 17:29:09 · 119 阅读 · 0 评论 -
pytorch OutOfMemoryError
before:after:ok....看到这个提示,表示您的GPU内存不足。由于我们经常在PyTorch中处理大量数据,因此很小的错误可能会迅速导致程序耗尽所有GPU;好的事,这些情况下的修复通常很简单。原创 2023-01-11 09:55:54 · 806 阅读 · 0 评论 -
DQN PYTORCH 玩FlappyBird
【代码】DQN PYTORCH 玩FlappyBird。原创 2022-12-28 14:58:50 · 352 阅读 · 0 评论 -
spinningup
【代码】spinningup。原创 2022-12-15 17:01:45 · 305 阅读 · 0 评论 -
gym 动作空间,观测空间学习
gym 动作空间,观测空间学习原创 2022-10-27 14:57:42 · 1250 阅读 · 0 评论 -
mujoco填坑
【代码】mujoco填坑。原创 2022-10-27 09:44:02 · 1129 阅读 · 0 评论 -
spinningup源码学习一
从examples入手,理解ExperimentGrid。原创 2022-10-25 11:10:17 · 392 阅读 · 0 评论 -
gym demo
import gymimport numpy as npenv = gym.make("AirRaid-v0")observation = env.reset()for _ in range(1000): env.render() action = env.action_space.sample() observation, reward, done, info = env.step(action) if done: observatio...原创 2022-01-19 14:43:19 · 572 阅读 · 0 评论 -
gym pendulum-v0环境
pendulum-v0环境state: theta, thetadot thetadot 是啥?observation : np.cos(theta), np.sin(theta), thetadot原创 2022-01-24 17:54:37 · 1468 阅读 · 0 评论 -
gym FrozenLake 理解学习
0 左1下2右3 上奖励: 稀疏奖励, 全0,当到达目标奖励为1。终止:到达目标或者到达H>>> import gym>>> env = gym.make( "FrozenLake-v0", is_slippery=False)>>> env.reset()0>>> env.render()SFFFFHFHFFFHHFFG>>> env.step(0)(...原创 2022-03-07 11:48:16 · 2903 阅读 · 0 评论 -
MuJoCo(一)安装
mujoco开源免费了。下载两个文件,将mjkey.txt放到bin中。执行simulate ../model/humanoid.xml原创 2022-01-26 15:46:19 · 455 阅读 · 0 评论