Reinforecement Learning 论文及github仓库汇总
环境:
参考github:https://github.com/openai/gym
v0和v4的env差别在于有无0.25的repeat_action_probability,前者有,后者没有。
有无ram的差别在于input,是2d image(pixel) 还是1d array。更详细的解释可参考:https://stackoverflow.com/questions/45207569/how-to-interpret-the-observations-of-ram-environments-i
原创
2020-07-31 17:58:44 ·
427 阅读 ·
0 评论