论文简析
Demian_Neit
RL,IRL,GAN,ROS,DL
展开
-
Generative Adversarial Imitation Learning 论文简析
《Generative Adversarial Imitation Learning》20161、几个概念:(1) occupancy measure ρπ(s,a): (2)cost function C(s,a), π策略下的累计回报:(3)causal entropy:(4) 学徒学习公式(5)用RTPO来进行策略更新,保证每个...原创 2019-03-04 15:05:40 · 1313 阅读 · 0 评论 -
Unsupervised Perceptual Rewards for Imitation Learning 论文简析
《Unsupervised Perceptual Rewards for Imitation Learning》1、摘要论文要点:(1)用视觉感知信息来将示范动作分解成一定的setp; (2) 使用Intention Network 来预训练 ImageNet,得到视觉特征表示(文中说这类网络训练的图像特征有很好的 迁移性);(3)实践证明由预训练得到的视觉特征可以直接用来...原创 2019-03-07 10:09:00 · 463 阅读 · 0 评论 -
Reinforcement and Imitation Learning for Diverse Visuomotor Skills 论文简析
《Reinforcement and Imitation Learning for Diverse Visuomotor Skills》27.may.20181、摘要我们提出了一种无模型深度强化学习方法,该方法利用少量演示数据来帮助强化学习代理。 我们将此方法应用于机器人操作任务,并训练直接从RGB摄像机输入映射到关节速度的端到端视觉运动策略。 我们证明了我们的方法可以解决各种各样的视觉运...原创 2019-03-04 17:02:59 · 639 阅读 · 1 评论