强化学习踩坑记录
躺着卷
这个作者很懒,什么都没留下…
展开
-
mujoco_py.builder.MujocoException: Got MuJoCo Warning: Unknown warning type Time = 0.1950.
解决办法:(1)为防止梯度爆炸,增加归一化 (2)对归一化分母加上合适大小的bias,过大也会导致超过float而变成nan。原因:网络权重,因为(1)梯度爆炸 或(2)分母 的原因变成nan,导致输出结果变为nan。导致强化学习环境报错。原创 2023-03-14 10:55:16 · 416 阅读 · 0 评论 -
使用pytorch-gpu训练,tensor全部归零!
解决办法:为了尽快完成项目,直接躺平,将cuda和pytorch-gpu全部删除,重装了cpu版本的torch,故障解除。原因:CUDA版本不匹配!原创 2023-03-14 10:51:45 · 389 阅读 · 0 评论 -
mujoco卡死在gym.make()
强化学习茫茫多的坑,记录一下困扰了一整天的bug上午运行还好好的,某次操作后,再次运行代码就会卡死在 env = gym.make(args.env)。原因在于,某次被迫中断后,产生了一个lock文件没有删除。将 .\python36\Lib\site-packages\mujoco_py\generated文件夹下 mujocopy-buildlock和mujocopy-buildlock.lock文件删除即可。............原创 2022-06-21 21:29:29 · 680 阅读 · 2 评论