机器学习顶会论文学习
文章平均质量分 95
weixin_mm975247003
做有趣的事,提升自己不是内卷,不积跬步无以至千里!
展开
-
论文学习—Model-based Adversarial Meta-Reinforcement Learning
强化学习论文学习原创 2024-03-04 02:09:12 · 994 阅读 · 1 评论 -
Fast deep reinforcement learning using online adjustments from the past
Fast deep reinforcement learning using online adjustments from the past1、介绍 摘要: 我们提出了短暂价值调整(EVA):是一种允许深度强化学习的agent快速适应其回放缓冲经验的方法。EVA从接近当前状态的replay buffer中用一个通过规划经验元祖得到的值函数估计值的神经网络来转移预测的值。EVA结合了一些最近的想法...原创 2019-10-17 22:18:04 · 469 阅读 · 0 评论