- 博客(1)
- 资源 (8)
- 收藏
- 关注
原创 【强化学习】GAIL生成对抗模仿学习详解《Generative adversarial imitation learning》
通过深度强化学习,我们能够让机器人针对一个任务实现从0到1的学习,但是需要我们定义出reward函数,在很多复杂任务,例如无人驾驶中,很难根据状态特征来建立一个科学合理的reward。人类学习新东西有一个重要的方法就是模仿学习,通过观察别人的动作来模仿学习,不需要知道任务的reward函数。模仿学习就是希望机器能够通过观察模仿专家的行为来进行学习。OpenAI,DeepMind,Google...
2018-09-27 10:26:43 33039 10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人