摘要
本文提出了LaneATT:基于锚的深度车道检测模型,类似于其他通用的深度对象检测器,该模型将锚用于特征池化步骤。
由于车道遵循规则模式且高度相关,因此我们假设在某些情况下,全局信息对于推断其位置可能至关重要,尤其是在诸如遮挡,缺少车道标记等情况下。因此,这项工作提出了一种新颖的基于锚点的注意力机制,该机制聚集了全局信息。
引言
诸如多项式回归模型之类的某些方法也可能会遭受由长尾效应引起的数据不平衡问题,因为曲线较锐利的情况不太常见。 此外,该模型不仅必须是鲁棒的,而且必须是有效的。 在几种应用中,车道检测必须实时或更快速地执行,以节省其他系统的处理能力,这是许多模型难以应付的要求。
相关工作
只关注基于深度学习的方法。
语义分割方法
像素级别分类其前景或背景。SCNN很慢。SAD。 CurveLanes-NAS要消耗大量资源。
行级别的分类方法
把图像网格化,在每一行找到最可能的格子。但对每条车道线都要重复一次。例如:E2E-LMD、IntRA-KD。
其他方法
FastDraw。PolyLaneNet:直接输出多项式所代表的车道线。Line-CNN:基于锚的方法
可复用性
大多方法不提供源码,导致复用性差。
本文所述方法
基于锚的单阶段模型(像YOLO3或者SSD)。整体框架图如图1所示。接收RGB图像
作为输入,输出是车道边界线。
CNN作为backbone产生特征图,然后将其池化以提取每个锚点的要素。这些特征与注意力模块生成的一组全局特征结合在一起。 通过组合局部和全局特征,模型可以更轻松地使用其他车道的信息,这在有遮挡或没有可见车道标记的情况下可能是必需的。 最后,将合并的特征传递到全连接层以预测最终的输出车道。
车道和锚点表示
车道用2D点表示,Y坐标等距采样。
因为Y是固定的,车道可用X坐标表示。
每一个Xi与各自的Yi有关。
由于大多数车道不会垂直穿过整个图像,因此使用起始索引s和终止索引e定义X的有效连续序列。
与Line-CNN [13]类似,我们的方法使用线而不是框来执行基于锚的检测,这意味着将使用这些线作为参考来制定车道的可能提议。