本文主要讨论新的基于机器学习的自动驾驶技术栈,传统的SLAM不在讨论范畴
感知
目前的感知主要分为针对视觉(图片)的感知,和对激光雷达获取的点云的感知,以及针对两者融合的感知。
视觉感知
BEV空间
Occupancy Network
Object Detection
PV空间
激光感知
定位
目前的定位主要有视觉定位和激光定位,也有一些融合定位的方法。
常用的方法SuperPoint, SuperGlue, ACE
矢量化
主要是提取建模道路面上的车道线等地面标志信息。以及一些杆牌等信息。
建图
建图实际上是一个包括了感知定位矢量化的过程,当然如果是图商,还涉及到一系列的相对精度和绝对精度的工艺要求,以及后续corner cases的人工参与来保证交付标准。
决策规划
从我目前的理解来看,自动驾驶相关的技术,大体可以分为这五个模块,建议从一个方面入手,逐渐生成对全局的理解领悟。
未来的主流趋势,是端到端的感知建图定位,传统的SLAM方法,比如VIO,LIO等目前还有不少厂商在用,但是随着技术升级,深度学习的不断迭代,这些方法都会被替换掉,因为比起基于规则的方法,数据驱动的方法才有着不断迭代进化的能力,这也是我们通往更强大,更广泛的人工智能的必经之路。
当然提到了数据驱动,目前还有一个技术就是仿真平台, 仿真平台可以生成高精度的训练数据,用于自动驾驶模型的初步训练,然后再用真实世界的数据进行fine tune, 这样做的一个目的是为了节约数据采集的成本,当然,随着时间的推移和数据的积累,数据还是否会是一个瓶颈?这是个问题.
思考: 自动驾驶技术,能否迁移到其余的地方?机器人领域?三维重建领域?自动化的矿山开采以及其他领域?物流领域?
在人工智能的时代, 很多时候想象力比技术本身更加重要.