Watch,Try, Learn: Meta-Learning from Demonstrations and Rewards读书笔记
Abstract
\quad Imitation learning 允许 agent 从 demonstrations 中学习 复杂的行为。然而学习一个复杂的视觉任务需要很大的 demonstrations。Meta-imitation learning 可以通过学习类似任务的经验,使 agent 从一个或几个 demonstrations 中学习新任务。在 task ambiguitytask\ ambiguitytask ambiguity 或是 unobserved d
原创
2021-01-19 10:31:33 ·
411 阅读 ·
0 评论