RL
文章平均质量分 85
gdhy9064
这个作者很懒,什么都没留下…
展开
-
基于超级玛丽的PPO算法实现【TF 2.4】
本文参考了目前已有的PPO算法在超级玛丽的pytorch实现,实现了tensorflow版本的PPO算法,并参照已有实现使用多进程收集训练数据,提高训练效率。原创 2021-01-05 18:00:56 · 1483 阅读 · 8 评论 -
无X server服务器运行Unity ML-Agents与python mlagents API对接
本文利用proot和Xvfb实现在无X server且无root权限的服务器(如只提供Jupyter Lab的服务器)上运行带GUI的Unity ML-Agents,方便使用python mlagents API在服务器上训练模型。原创 2020-10-02 23:16:16 · 899 阅读 · 0 评论 -
基于Pendulum的DDPG简洁示例【TF 2.X】
本文提供了tensorflow 2.X 下一个基于Pendulum环境的DDPG算法的优雅而简洁的示例,旨在帮助曾像我一样因为难以发现的小疏忽而无法复现的小伙伴们。原创 2020-09-26 14:53:29 · 962 阅读 · 0 评论