【论文笔记】DPFT: Dual Perspective Fusion Transformer for Camera-Radar-based Object Detection

byzy

于 2024-07-20 14:25:25 发布

阅读量872

点赞数 10

分类专栏： # 雷达与图像融合多模态融合3D感知（目标检测为主）文章标签：论文阅读目标检测自动驾驶计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45657478/article/details/140379323

版权

原文链接：https://arxiv.org/abs/2404.03015

简介：本文提出双视角融合Transformer（DPFT），利用低级的雷达数据（雷达张量）以保留更多信息，并使用4D雷达在相机和地面的投影以简化与图像的融合。DPFT在K-Radar数据集上能达到SotA性能，且对极端天气具有鲁棒性，并有更低的推断时间。

在这里插入图片描述

0. 方法概述

DPFT可处理多模态融合的主要挑战，即传感器的感知维度、数据表达和分辨率差异。
在这里插入图片描述
首先，使用包含更多信息的雷达张量，并减小雷达数据与图像的分辨率差异。然后使用4D雷达张量创造两个投影：一个平行于图像平面，以进行图像和雷达数据的融合；另一个与之垂直，以保留互补的雷达信息。此外，模型内的两模态无依赖关系，在一个模态失效时也可正常运行。

1. 数据准备

传统雷达表达在与图像平面垂直的BEV下，导致图像与雷达的融合困难。因此本文使用4D雷达张量，但4D数据的处理需要大量计算，且将图像提升到3D与雷达融合十分困难。因此本文将雷达数据投影到距离-水平角（

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

byzy 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。