Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection

Abstract

LaneATT 是一个anchor-based深度车道线检测模型,它类似一般的深度目标检测器,使用anchors(锚点)进行特征池化步骤。由于车道线遵循规则(交通规则)并高度相关,因此我们假设在某些情况下,全局信息对于推断其位置可能至关重要,尤其是在诸如遮挡,缺少车道标记等情况下。因此,我们提出了一种新颖的基于anchor的注意力机制,该机制聚集了全局信息。

laneatt 的前半部分(anchor-based Feature Pooling),该部分包括: anchor的角度设置,生成anchor,anchor预计算,基于anchor的回归等,具体的解释查看论文 Line-CNN:End-to-End Traffic Line Detection With Line Proposal Unit. 该论文详细介绍了基于anchor的fasterRCNN和LineCNN的区别,而在laneatt中,论文主要重点在attention Mechanism机制.

Proposed method

LaneATT 是一种基于anchor的单级模型,类似YOLOv3或SSD。下图是方法的概述,模型输入的是RGB图像,输出的是车道的边界线。LaneATT 使用Resnet提取特征,生成一幅图的特征映射。将特征图汇集起来以提取每个anchor的特征(每个anchor被投影到特征映射上,然后reshape,生成局部特征)。这些特征与一组由注意力模块产生的全局特征相结合,通过结合局部和全局特征,这在遮挡或没有可见车道标记的情况下可以更容易地使用来自其他车道的信息。 最后,将组合特征传递给全连接层,以预测最终的输出车道。
在这里插入图片描述

车道线和锚点的表示

沿图片纵向做等分操作,得到的等分点记作[公式],其中[公式]

对于每条车道线,令 Y 固定,因此[公式]决定了每条车道线的差异;每个 Xi 都与对应的[公式]形成车道线上的一个点。

由于车道线不会贯穿整张图像,令 s 和 e 分别表示 X 的开始索引和结束索引,用于表示车道线的连续有效点。

使用线而不是方框进行基于锚点的检测。这意味着锚点是一条虚线,由 原点 和 方向 表示锚点在这里插入图片描述
。原点总是位于图像的左、右、下三个边界上。

Backbone

使用诸如ResNet的通用网络作为LaneATT的backbone。这一阶段的输出是一个特征映射,记作[公式],每个锚的特征将通过池化过程提取。为降维,通道缩减,减少后续模块计算量,对 Fback 做 1X1 卷积,将输出结果记作[公式]

Anchor based feature pooling

对于每个anchor,都要从 F 中提取特征,使用坐标索引要从 F 中提取的特征点。先定义这些坐标点的 y 方向坐标:在这里插入图片描述,使用如下公式求它们对应的 x 坐标:在这里插入图片描述
在这里插入图片描述
这里的池化不是使用池化操作,而是使用锚点本身实现单级检测器。并且ROI pooling也是不需要的。

Attention mechanism

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Proposal prediction

在这里插入图片描述

NMS

在这里插入图片描述

https://zhuanlan.zhihu.com/p/391366412

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值