目录
Plain Vision Transformer (PlainViT)
前言
自动驾驶是一项复杂的技术,其核心包括传感器感知,行为决策,高清地图,海量数据,高性能计算平台等等。目前,基于深度学习的方法在传感器感知方面取得了突破性的进展,并因此推动了自动驾驶技术的飞速发展。自动驾驶技术所采用的传感器主要包括摄像机,激光雷达和毫米波雷达。摄像机用于采集可见光图像,对于物体的形状和类别的感知精度较高。由于深度学习技术的成功起源于计算机视觉任务,很多成功的算法也是基于对图像数据的处理,因此基于摄像机的感知技术目前已经相对成熟。图像数据的缺点在于缺少了场景和物体的距离信息,且受天气和环境的影响较大。激光雷达在一定程度上弥补了摄像机的缺点,可以精确的感知物体的距离,但是限制在于成本过高,难以大批量生产。毫米波雷达具有天线波束窄、分辨率高、频带宽、抗干扰能力强等点, 可以比较精确的测量物体的速度和距离,受天气和环境影响较小,而且成本较低,易于大规模生产,因为也成为了目前自动驾驶技术研究的一个热点方向。
算法原理
传统的雷达感知技术包含大量基于规则的算法。这些规则是研究和工程人员利用先验知识和实际数据总结出来的。人类的先验知识是有限的,可处理的数据也是有限的,因此这些规则并不完备,无法涵盖实际场景中的所有情况,而深度学习技术可以自动的从海量数据中获取知识和规则。随着数据不断累积,知识和规则的学习也就越来越完备,并超越基于人工规则的算法。因此,近些年来&#