![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
模仿学习
idestina
这个作者很懒,什么都没留下…
展开
-
论文笔记 Learning to Drive from Simulation without Real World Labels
问题背景:模拟器的发展越来越好,在模拟器上进行实验有很多好处:可以自由地改变环境外观、照明和天气条件,描述周围障碍物复杂性的更多结构变化,可以模拟在现实世界中难以(或危险)复制的场景。同时,模拟器统计提供了ground-truth表示,如语义,车辆相对道路的位置和角度。在模拟器上进行训练和测试的模型是“doomed to succeed”事件,即注定会成功的,但是这样训练出来的模型在真实世界中是incapable的,因为存在 “reality gap”,即模拟器和真实世界的差距:在外观上的差异(原创 2020-07-15 01:41:15 · 580 阅读 · 0 评论 -
End-to-end Driving via Conditional Imitation Learning 论文笔记
论文翻译参考:https://blog.csdn.net/weixin_40523230/article/details/90300337一、为什么提出条件模仿学习模仿学习应用在自动驾驶的弊端:经典模仿学习的目标函数如下公式(1),是一个observation->action的映射,可以解决道路追踪的问题,但是在复杂环境中是很难的,因为同样的环境转向或者控制可能不同,比如同样在一个十字路口,右转和左转取决于目的地,没有加条件的经典模仿学习训练出来的agent可能会在十字路口做出武断的决定,乘客原创 2020-06-04 01:16:30 · 1409 阅读 · 1 评论