论文地址:Spatial As Deep: Spatial CNN for Traffic Scene Understanding
代码:SCNN
摘要:
卷积神经网络通常是逐层堆叠的卷积操作构成,虽然有强大的特征提取能力,从像素中提取语义信息,但是跨行列提取图像的空间信息的能力并没有完全被利用。这些信息对像车道线和电线杆这种有很强的外观先验很弱的外观线索的目标是很重要的,这些目标经常会被遮挡或没画出来,如图一所示。作者提取出了空间卷积神经网络(SCNN),将传统的逐层卷积替换为特征图内的切片卷积操作,这可以使得信息可以在图像的行列之间传递。作者还公布了一个车道线检测数据集,并用SCNN在这个数据集上做了测试取得了很好的效果。而且作者用这个SCNN取得了图森举办的车道线检测大赛第一名。
思路:
论文主要的动机是为了解决特征图上空间信息传递问题,也就是所说的建立像素点之间的空间关系,之前的方法有基于RNN的,有基于MRF/CRF后处理的,基于RNN的由于信息传递范围有限导致性能不是很好,基于MRF/CRF的因为计算代价太大,而且性能也有待提高。
还有就是,作者公布了一个很大的车道线检测数据集CULane,有88880张标注好的训练图像,9675张验证图像,34680张测试图像。其中训练集合验证集都标注了,测试集没有标注,标注方法是对车道线进行像素级标注,标注当前车道和相邻车道车道线,对于遮挡部分,也标注出来了。总共有九个场景,具体可参见下图: