Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection（LaneATT）论文阅读

最新推荐文章于 2023-10-07 17:16:56 发布

ManiacLook

最新推荐文章于 2023-10-07 17:16:56 发布

阅读量2.6k

点赞数 2

文章标签：计算机视觉人工智能深度学习目标检测

本文链接：https://blog.csdn.net/ManiacLook/article/details/122560253

版权

本文介绍了LaneATT论文，该模型提出了基于像素的注意力机制，实现了一个轻量级的单阶段车道检测系统，提高了在复杂场景下的检测精度，并优化了训练和推理速度，达到了250 FPS。通过车道的像素表示、特征池化和注意力模块，模型能有效捕捉全局信息，提高检测效率。

摘要由CSDN通过智能技术生成

原文地址

1.创新点

提出了一种聚合全局信息的，新颖的基于 anchor 的注意力机制。

提出了一种基于 anchor 的单阶段车道检测模型，称为 LaneATT。它的架构允许使用轻量级 backbone CNN，同时保持高精度。

基于 anchor 的特征池化通过使用 anchor 本身来实现单级检测器，可以潜在地探索所有特征图，从而能够使用更轻量级的 backbone 和更小的感受野。

2.解决了哪些问题

一种车道检测方法，在大型复杂数据集上比现有最先进的实时方法更准确。

与大多数其他模型相比，该模型能够实现更快的训练和推理时间（达到 250 FPS，并且乘加运算 (MAC) 比之前最先进的模型少了一个数量级）。

3.原理和算法步骤

LaneATT 是一种基于 anchor 的单阶段模型，RGB 图像 $I∈R^{3×H_I×W_I}$ 作为输入，输出是车道边界线。

作为主干的 CNN 会生成一个特征图，然后将其池化以提取每个 anchor 的特征。这些特征会和由注意力模块提取的一组全局特征相结合。最后，组合特征被传递到全连接层以预测最终输出车道。
在这里插入图片描述

3.1.车道和 `anchor` 表示

车道由等距 y 坐标 $\{y_i\}^{N_{pts}-1}_{i=0}$ 和 x 坐标 $\{x_i\}^{N_{pts}-1}_{i=0}$ 。

基于锚的检测时使用线，由 (i) 位于图像边界之一的原点 $O = (x_{orig},y_{orig})$ (其中 $y_{orig} ∈Y$ ) 和 (ii) 方向 θ 形成。使用起始索引 s 和结束索引 e 来定义 X 的有效连续序列。

3.2.主干网络

用如 resnet 的通用 CNN 输出特征图 $F_{back} ∈ R^{C^′_F ×H_F ×W_F}$ ，再用 1 x 1 卷积对 $F_{back}$ 进行降维，生成通道缩减的特征图 $F ∈R^{C_F ×H_F ×W_F}$ 。

3.3.基于 `anchor` 的特征池化

锚定义了将用于各个建议的 F 点。由于锚被建模为线，因此给定锚的兴趣点是那些与锚的虚拟线相交的点。对于每个 $y_j = 0,1,2,...,H_F -1$ ，将有一个对应的 x 坐标，
$x_j = \frac{1}{tan\theta}(y_j-y_{orig}/\delta_{back}+x_{orig}/\delta_{back})————(1)$

最低0.47元/天解锁文章

ManiacLook

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
3
评论
Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection（LaneATT）论文阅读

文章目录1.创新点2.解决了哪些问题3.原理和算法步骤3.1.车道和 `anchor` 表示3.2.主干网络3.3.基于 `anchor` 的特征池化3.4.注意力机制3.5.`proposal` 预测3.6.`NMS`3.7.模型训练3.8.`anchor` 过滤以提高速度效率1.创新点提出了一种聚合全局信息的，新颖的基于 anchor 的注意力机制。提出了一种基于 anchor 的单阶段车道检测模型，称为 LaneATT。它的架构允许使用轻量级 backbone CNN，同时保持高精度。
复制链接

扫一扫