论文精读
文章平均质量分 91
luckywlj0115
这个作者很懒,什么都没留下…
展开
-
JoyRL阅读笔记-3-Scalable trust-region method for deep reinforcement learning using Kronecker-factored
可扩展的TRPO原创 2022-11-14 17:05:07 · 732 阅读 · 1 评论 -
JoyRL阅读笔记-2-Trust Region Policy Optimization
深度强化学习TRPO算法原创 2022-11-05 22:03:45 · 471 阅读 · 0 评论 -
JoyRL文献笔记-1-Playing Atari with Deep Reinforcement Learning
DRL系列论文精读笔记原创 2022-11-01 16:02:01 · 1056 阅读 · 0 评论