![19d64b958811256ee541ee5d16e2397f.png](https://i-blog.csdnimg.cn/blog_migrate/f0d0eb71130136320486cf943937107f.jpeg)
arXiv2020年2月18日韩国GIST(Gwangju Institute of Science and Technology)上载的论文“Key Points Estimation and Point Instance Segmentation Approach for Lane Detection”。
![b206701e70a37d37518506c2c5e9e1da.png](https://i-blog.csdnimg.cn/blog_migrate/bb77c7ab78940988b36ab988f954ddb9.jpeg)
摘要:最新出来的车道检测方法可实现成功的性能。尽管具有优势,但这些方法仍存在严重缺陷,例如可检测的车道数量有限和虚警率很高。特别是高误报率会导致错误和危险的控制。本文提出了一种深度学习车道检测方法,对任意数量的车道进行检测,比其他最近的车道检测方法有更低的误报率。该方法的体系结构共享特征提取层并拥有多个分支用于检测和嵌入到集群车道。所提出的方法可以在车道生成精确的点,并且针对生成的点将聚类问题作为一个点云实例分割问题。所提出的方法更紧凑,因为它产生的点少于原始图像像素的大小。提出的后处理方法可以成功消除出格点,并显着提高性能。整个框架在tuSimple数据集上取得了竞争性结果。代码可在https://github.com/koyeongmin/PINet获得。
如图所示,给定输入图像,PINet会预测三个值,置信度、偏移量和特征。 根据置信度和偏移量输出,可以预测车道上的精确点,并且特征输出将预测点分割到每个实例中。 最后,应用后处理模块生成平滑车道。
![5bb56ff8c3a41bc0e67fa2a1495e7cc4.png](https://i-blog.csdnimg.cn/blog_migrate/1d79d18b0cbda6ec83991ca3c1956c41.jpeg)
这项工作训练用于车道检测的神经网络, 该网络称为点实例网络(PINet,Point Instance Network)。该网络的损失函数受到相似性组提议网络(SPGN,Similarity Group Proposal Network)的启发,后者是3D点云实例分割框架。 与计算机视觉领域中的其他实例分割方法不同,提出的方法仅对预测点而不是所有像素都要嵌入。 在这方面,3D点云实例分割方法适用于该任务。 另外,简单的后处理方法适用于网络的原始输出。
如图所示是其详细的网络训练程序,包括三个主要部分。 大小调整为512x256的输入数据由大小调整层(resizing layer)压缩,并将压缩的输入传递到特征提取层。 在每个沙漏(hourglass)块的末尾有三个输出分支,分别预测每个网格的置信度、偏移量和实例特征。 损失函数可以根据每个沙漏块的输出来计算。
![5f3e65aee583d84981eb7108b43b936c.png](https://i-blog.csdnimg.cn/blog_migrate/be3a988094538741ac145f69f031db0f.jpeg)
特征提取层的灵感来自于堆叠的沙漏网络,该网络在关键点预测上实现了出色的性能。
下图显示沙漏块的详细架构:蓝框表示下采样的瓶颈层,绿框表示相同的瓶颈层,而橙框表示上采样的瓶颈层。批处理归一化(BN)和Relu层跟在每个卷积层之后,除非它们在输出分支才应用。输出分支的滤波器器数量由输出值确定。例如,置信度分支为1,偏移分支为2,特征分支为4。
![4e65921dbeadde235a7488a9c349d48c.png](https://i-blog.csdnimg.cn/blog_migrate/ae42d454fcf05b95b7ecfd0be32ad4fe.jpeg)
大小调整层和每个瓶颈层的详细信息可以在该表中看到。
![c4e6d157699bbcf04401de8b91e3d798.png](https://i-blog.csdnimg.cn/blog_migrate/9069830d46050611f1375e8e4bcc1e1f.jpeg)
三个分支的损失函数分别为:
![bc0aca29838bc5a165b01356e49a00aa.png](https://i-blog.csdnimg.cn/blog_migrate/4da47a5aba44af422cbf2d9a5839e5c2.png)
![ff97fa187ef078c2afa64be828da59f3.png](https://i-blog.csdnimg.cn/blog_migrate/202e591ccfa927d7c7161b5662b0c42e.png)
![8b4b29005462e3f8e687c0a5de2be351.png](https://i-blog.csdnimg.cn/blog_migrate/61b214a72b9bf835e965ae550ac11bf2.png)
总损失函数为三个之和
![98d712e5104004a93935897c920aafb5.png](https://i-blog.csdnimg.cn/blog_migrate/de7a07e8df463470cbf912e7f3521e97.png)
关于后处理,见下图所示:(a)是输入图像,(b)是PINet的原始输出。 在(b)中,蓝车道包含一些出格点,而其他车道则可以区分出来。 在(c)中,后处理方法的结果是消除出格点,仅保留最长的平滑车道。
![01248592cb048d3d9d0fe10285265d88.png](https://i-blog.csdnimg.cn/blog_migrate/18a79037cb33a4ab8ea2b9ac9a726044.jpeg)
下图给出一些结果示例:(在tuSimple数据集上)
![a69d9f690b07ae220389f6b727aebf55.png](https://i-blog.csdnimg.cn/blog_migrate/26b3f5c1de2d0099ebec327f05d9a122.jpeg)