行为克隆(End to End Learning for Self-Driving Cars 论文翻译)

本文介绍了如何使用卷积神经网络(CNN)进行端到端学习,将摄像头输入直接转化为自动驾驶汽车的转向指令。系统通过少量人类驾驶数据,学会了在各种路况下驾驶,包括无车道标记的路段、停车场和未铺设的路面。相比于传统的模块化驾驶系统,端到端学习能自我优化内部组件,可能实现更好的性能和更小的网络。该系统在模拟和实路测试中表现出色,能够在多种天气和光照条件下自主驾驶。
摘要由CSDN通过智能技术生成

摘要:我们训练了一个卷积神经网络(CNN)来将原始像素从一个向前倾斜的摄像头直接映射到转向指令。事实证明,这种端到端的方法非常强大。通过最少的人类训练数据,该系统学会了在有或没有车道标记的地方道路和高速公路上驾驶。它还在一些视觉引导不清晰的区域开展业务,比如停车场和未铺设的道路上。
该系统只以人的转向角作为训练信号,自动学习必要的过程步骤的内部表示,如检测有用的道路特征。我们从未明确地训练它去探测,例如,道路的分界线。
相对于车道标记、路径规划和控制等问题的显式分解,我们的端到端系统同时优化了所有处理步骤。我们认为这将最终导致更好的性能和更小的系统。更好的性能将产生,因为内部组件自我优化,以最大限度地提高整个系统的性能,而不是人工选择的中间标准,如车道检测。可以理解的是,选择这样的标准是为了便于人工解释,而不是自动地保证最大的系统性能。较小的网络是可能的,因为系统学会用最少的处理步骤来解决问题。
我们使用了NVIDIA DevBox和Torch 7进行培训,使用了NVIDIA DRIVE TM PX自动驾驶汽车计算机,也使用了Torch 7来决定去哪里驾驶。该系统以每秒30帧(FPS)的速度运行。

1介绍

CNNs[1]已经彻底改变了模式识别[2]。在CNNs被广泛采用之前,大多数模式识别任务都是使用手工制作的特征外向性的初始阶段和随后的分类器来完成的。CNNs的突破是通过训练实例自动学习特征。在图像识别任务中,CNN方法尤其强大,因为卷积运算可以捕获图像的二维性质。此外,通过使用卷积核扫描整个图像,相对于操作的总数,需要学习的参数相对较少。

虽然具有学习功能的CNNs已经在商业上使用了20多年的[3],但由于最近的两个发展,它们的采用在过去几年出现了爆炸性增长。首先,大型标记数据集,如大规模视觉识别挑战(ILSVRC)[4]已经成为培训和验证的有用工具。其次,CNN学习算法已经在大规模并行图形处理单元(gpu)上实现,极大地加速了学习和推理。

在本文中,我们描述了一个超越模式识别的CNN。它学习驾驶汽车所需的整个处理过程。这个项目的基础工作是在10多年前的一个国防高级研究计划局(DARPA)的幼苗项目中完成的,该项目被称为DARPA自动车辆(DAVE)[5],在这个项目中,一辆亚规模的无线电控制(RC)车行驶在一条垃圾填埋场的小路上。戴夫在类似但不完全相同的环境中接受了数小时的人类驾驶训练。训练数据包括来自两个摄像头的视频,以及来自人类操作员的左右转向指令。

在很多方面,DAVE-2的灵感来自于波默劳[6]的开创性工作,他在1989年在一个神经网络(ALVINN)系统中建立了自动陆地交通工具。它证明了末端训练的神经网络可以独立于方向盘和公共道路。25年的进步让我们可以在这项任务中运用更多的数据和计算能力。此外,我们在CNNs方面的经验使我们能够利用这一强大的技术。(ALVINN使用了一个全连通的网络,但以今天的标准来看,这个网络很小。)

虽然DAVE展示了端到端学习的潜力,并且确实被用来证明启动应用于地面机器人(LAGR)项目[7]的DARPA学习是合理的,但DAVE的表现还不够可靠,不足以提供一个完整的替代更模块化的越野驾驶

  • 2
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值