深度强化学习
Lovelation
北航雪渣…
展开
-
强化学习中的on-policy和off-policy解释
强化学习中的On-policy和off-policy的区别原创 2020-03-22 11:56:41 · 4886 阅读 · 0 评论 -
Improving Sample Efficiency In Model-Free Reinforcement Learning From Images 论文翻译
Improving Sample Efficiency In Model-Free Reinforcement Learning From Images 论文翻译,纯手工翻译,难免有错误,希望和大家多多交流,有错误请在评论指出,谢谢!原创 2020-03-15 23:40:42 · 1316 阅读 · 2 评论 -
Soft Actor-Critic 论文翻译
本文对SAC算法论文进行了全文翻译,纯手工翻译,略显粗糙,有些地方翻译的可能不对,希望与大家多交流,有问题可以评论指出,谢谢!原创 2020-03-15 23:24:55 · 2274 阅读 · 0 评论