【论文笔记】EA-LSS: Edge-aware Lift-splat-shot Framework for 3D BEV Object Detection

最新推荐文章于 2024-09-13 07:58:45 发布

byzy

最新推荐文章于 2024-09-13 07:58:45 发布

阅读量1.9k

点赞数 15

分类专栏：基于BEV特征表达的自动驾驶视觉感知 # 基于BEV特征表达的摄像机3D目标检测文章标签：论文阅读目标检测自动驾驶深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45657478/article/details/138530435

版权

原文链接：https://arxiv.org/abs/2303.17895

引言

目前的基于图像的BEV感知方法多使用LSS预测像素的深度分布，并根据深度估计将2D特征提升到3D空间。然而，实际场景中区域的深度差异较大（“深度跳变”），会导致不能准确估计边缘的深度。

为提高深度跳变区域深度估计的精度，本文提出边缘感知的深度融合（EADF）模块，为深度网络提供额外的边缘信息，以适应深度的快速变化。

此外，目前的方法不能充分利用来自点云的深度监督，本文提出细粒度深度（FGD）模块，包含上采样分支，用于匹配预测特征图和真实深度图的大小。该模块使深度估计网络更细粒度地感知深度分布，并尽可能多地保留原始深度信息。该模块仅用于训练，不会增加推断时间。

本文的方法称为边缘感知的LSS（EA-LSS），可适用于任何使用LSS的方法。

方法

在这里插入图片描述

细粒度深度模块

来自点云的深度图及其稀疏，存在大量零值。为保留精确的深度信息，本文提出细粒度深度（FGD）模块，使用上采样分支处理预测深度图，该上采样分支作为额外的深度估计网络用于监督。

该模块使用focal损失作为细粒度深度损失以关注前景物体。来自点云投影的多视图深度图 $D\in\mathbb R^{N_v\times H\times W}$ 作为真值（其中的非零值转化为独热向量），与上采样分支的输出 $D^{pred}$ 计算FGD损失：
$L_{FGD}=\sum_{i=1}^n\sum_{c=1}^{H_D}-\alpha_c(1-y_{i,c})^\gamma\log(\hat y_{i,c})$

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

byzy 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。