RADIANT:一种全新的雷达图像关联网络用于3D目标检测

RADIANT:一种全新的雷达图像关联网络用于3D目标检测

论文地址:RADIANT: Radar-Image Association Network for 3D Object Detection

源码:https://github.com/longyunf/radiant

单位:密歇根大学、福特

动机

作为一种能够直接测量深度的传感器,其相较于Lidar存在较大的误差,因此利用雷达本身精度难以精确地将雷达结果与单目方法的3D估计相关联。本文提出了一种融合网络RADIANT来解决雷达-摄像机关联的挑战。通过预测雷达点到真实目标中心点的3D偏移,随后利用修正后的雷达点修正图像预测结果,使得网络在特征层和检测层完成融合。

贡献

  1. 通过增强毫米波点云获得3D目标的中心位置
  2. 使用增强后的毫米波点云完成相机-雷达的检测结果关联
  3. 在多个单目SOTA模型中验证了结构有效性并取得SOTA

背景&问题定义

正雷达样本点

对于目标检测的训练,关键就是:候选点的选择、定义正负样本,FCOS3D将每个像素点作为目标候选点,而正样本点定义为GT目标中心周围的区域内。同样,对于本文,我们将每个雷达反射点作为目标的候选点,将成功与目标相关联的雷达像素点作为正样本点。但是,由于毫米波反射点的模糊性(存在多径干扰)和不准确性(检测的分辨率不高)等问题,导致反射点许多无法反映真实的目标位置框内,同时目前的主流多模态数据集(radar+camera)没有提供point-wise(点云级别)的标记,以上两种原因导致了:现有的毫米波反射点无论是精度上还是标注上,都需要做一些工作。

由此,作者如此解决:

  1. 3D框内部的点云当然归属于对应目标,但是对于外部点云,作者设置距离阈值将一定范围内的点云考虑在内
  2. 同时为了防止误召回,上一步召回的点云还需要再径向速度上与分配的GT目标相差在一定范围内

Radar Depth Offset

image-20221230200327216

z为反射点相关联的目标深度,z_r为反射点的原始测量深度

细化动机:

  1. 单目3D检测性能一直受到深度估计不精确问题的裹挟
  2. 毫米波雷达能提供相较相机更精确的深度,但是其稀疏性、穿透性导致其很难反映出目标真实中心,甚至出现幽灵点,反射点到物体中心的偏移是未知的,但是又是关键的,我们通常需要通过物体的中心特征回归目标的各类属性
  3. 预测的偏移不仅要包括深度偏移,还有image-plane的投影像素偏移,补偿雷达反射点在横向等方向上误差
  4. 因为点云和目标匹配需要类别信息,毫米波用于分类的信息较少(无法通过形状判断)

网络架构

image-20221230200032823

整体上,作者使用“双流”网络结构,图像、雷达分支分别使用原始FCOS3D网络、引入图像特征的轻量级FCOS3D网络,在Depth Fusion结构中,通过DWN(depth weight net)对两个head预测结果引入可学习的深度加权网络,并在最后预测加权后的目标深度。

我们按照(Backbone, Neck, Heads):分别生成图像预测结果和点云预测结果, (Depth Fusion Modules):修正图像预测结果,两个部分介绍细节:

Backbone, Neck, Heads

image-20221230200105717

更进一步,对图像分支采用原始FCOS3D网络,不过多介绍。对Radar分支,输入的是投影到image-plane的数据,其中包括深度、坐标、速度、占位掩码(象征点云是否存在于像素中方便后面后处理),在neck部分加入了一些bottleneck瓶颈结构融合图像和雷达数据,解决点云分类能力不足的问题。最后就是在Head上,与图像的各类目标属性回归不同,点云只在其分布的投影像素中,计算类别得分、像素偏移、深度残差(偏移)三个属性。最后的结果形式如下。

image-20221230205517461

Depth Fusion Module

在得到heads的结果后,这部分的任务就是将两个模态的结果融合,用radar预测的结果修正图像预测结果:

  1. 关联投影后的雷达反射点radar pixels(预测修正后)与图像检测结果
  2. 对关联后的每个radar pixels预测深度可靠性概率
  3. 利用加权后的radar pixels,修正目标的深度,对于目标的尺度、角度等属性不做修改,作者认为是毫米波缺少目标朝向、尺度信息

  • Radar-Camera Association
image-20221230211622074

由上图,我们已得到两个Heads的输出,我们取图像预测结果的前1000个boxes按照得分,同样,我们也取radar预测结果中满足置信度>T_r的radar pixels用于融合,我们把雷达预测结果先修正:

image-20221230211900947

修正后,进行关联:匹配要满足以下条件:首先,类别相同,其次投影像素差在一定范围内,最后,深度误差在一定范围内,由此,完成筛选和匹配,假设两个Heads结果分别是M\N个,则复杂度为O(MN)

image-20221230211939612
  • Depth Weighting Network

上部分完成了radar pixels的筛选和匹配,本部分进行融合

这部分采用可学习的方式,与之对比的是将匹配的radar pixels深度与图像检测的深度进行平均相加这种不可学习的固定方式

image-20221230212527055

这个网络的目的,就是判断radar pixels是否可信,输出可信度,用于最后的融合。

那么如何规定训练标签呢?

DWN预测的是每个点的置信度,DWN前向完成后,结合图像预测和GT,给予每个点云权重标签,用于训练DWN,DWN仅根据点云head输出特征、原始深度等信息预测,如果GT与radar更接近,α标记为1,反之和图像预测的结果更接近则为0.


  • Fused Depth Calculation

image-20221230212915167

上一步预测的radar pixels权重,这一步根据权重融合加权得到结果,Tα就是阈值,如果任意点云的深度权重阈值<阈值,则只考虑相机的预测结果

实验

image-20221230213751693

作者对融合方式做了消融实验,其中None是不加入雷达反射点,Average代表平均反射点与图像预测深度,DWN是作者提出的深度权重网络。

image-20221230213607191

由上图,最上面的Table1,表述了从由近到远过程中,图像、原始雷达、修正后雷达(中间)的预测误差,可以看到经过offset的修正后,雷达的深度预测值在近处的修正作用占比更大。这里不要被作者的数据吓到,因为这是丈量雷达反射点到目标中心偏移误差,因为雷达反射点本身就分布在非车身中心。

上图中的Figure 4,分别代表:融合后目标深度预测值和雷达反射点之间的偏差,GT目标深度和雷达反射点之间的偏差,两者的偏差分布整体是相似的,预测结果的偏差分布更加均匀。

image-20221230213703711

Table2是NuScenes数据集上的实验结果对比,作者基于FOCOS3D, PGD两类单目检测模型改进,都得到了较大的提升,提升体现在mATE,AP两个数据指标上。同时,相比经典的centerfusion,也有较大的提升。

image-20221230213738574

Figure 5中,分散的反射点通过预测offset,集中于目标的中心,目标的深度也得到了进一步的修正。

简单总结:

  1. 作者提出的这种关联、更新方式,有效改善了单目单帧的目标深度预测能力,提出了细粒度更高的标记NuScenes毫米波点云的一种方式
  2. 根据具体场景,根据传感器特性,在feature-level和decision-level上多方式非对称融合往往更加有效
  3. 作者基于image-plane,选择的投影方式导致了点云偏移预测受限于特征提取方式,事实上雷达点云投影存在遮挡,同时点云稀疏,将其投影到image-plane上导致原本形状进一步丢失,进一步加剧了数据的稀疏性
  4. 作者只通过radar改善了目标的位置性能和平均精度,事实上目标的RCS等信息对于其他属性仍然有一定修正作用
  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
RadiAnt DICOM Viewer为图片操作和测量提供了以下基本工具: •流畅地镜头远近调节和摇摄 •亮度和反光调节,反色模式 •预置计算机断层扫描((如肺、骨头、等等)窗口的设置 •(90度、180度)图片旋转、(水平和垂直)图片翻转 •分段长度 •圆形/椭圆形和其范围内的中间、最小、最大参数值(如,计算机断层照相法中Hounsfield单位的密度) •角度值(标准角度和科布角度) •自由绘画的画笔工具 快如闪电 RadiAnt DICOM Viewer是为使客户尽可能有效地利用资源而设计。它不但能在大内存的多处理器和多核系统下运行,也能在旧款内存只有512MB的单核机上运行。 在必要的情况下,64位版本能为现代系统提供超过4GB容量,储存所有曾打开过的图像。非同步浏览可以让您在图片打开的状态下浏览和处理图片。 以上所有这些,只需要通过一个非常小巧,安装文件只有2MB大小的应用程序就可以实现。 多式DICOM的技术支持 该软件能够打开并展示不同格式的图片: •数字式放射照相术(CR, DX) •乳房X射线照相术(MG) •计算机断层照相法(CT) •磁共振(MR) •正电子发射计算机断层扫描PET-CT (PT) •超声波扫描术(US) •数字血管造影术(XA) •核医学照相术(NM) •二次图片和扫描的图像(SC) 许多种类的DICOM图像都可以得到技术支持: •单色的 (如:CR, CT, MR) 和彩色的 (如:US, 3D重建) •静态图像 (如:CR, MG, CT) 和连续动态图像(如: XA, US) •未压缩和压缩过的图像(RLE, 有损的JPEG, 无损的JPEG, JPEG 2000) 不同系列或研究的比较 为了比较单个图片的多个系列或者多个图片,目前都能再同一或者不同窗口中打开。 在同一平面中获取的图片(如在造影剂应用之前和之后的计算机断层扫描(CT)照片系列)系统可以默认自动同步。 当浏览不同面的解剖系列图像时,显示出的交叉参考线可以更好地展示相互间的联系 (如,磁共振图像)。 DICOM文件转换成为图像和视频 为了创建优秀视觉呈现和专业的出版——RadiAnt DICOM Viewer能够将DICOM文件转换成为JPEG格式图片(压缩的)或者BMP格式图片(未压缩的位图)和WMV视频(Windows媒体视频)。 一张图片,一整套系列或者全部打开的图片都可以同时被转换。 通过快捷键,同时按下CTRL+C,可以将显示的图片快速地复制到Windows剪贴板,并且能迅速地简单地粘贴到Word文档或PowerPoint文件。 多维重建 RadiAnt DICOM Viewer所提供的MPR工具可以用来在正交平面(冠状的、径向的、轴向的、倾斜的,取决于图像的基本平面)中重建图像。 重建过程相当迅速: 可以在大约三秒钟的时间,由超过2000张轴向CT断面切片重建出冠装位图像(在现代英特尔酷睿i7系统下)。 PET-CT 图像融合 在一个CT扫描件上覆盖一个彩色PET图像,从而获得FDG(氟脱氧葡萄糖)摄取量增加的区域的结构参考。 在指定区域,用椭圆工具来测量SUVbw(运用体重计算出的标准吸收值)的最大、最小和平均参数。 图像融合还能被运用到其他图像形式,如磁共振图像。DWI图像也能通过T1或者T2系列中扫描图像达到融合。 注意:这是一个安装软件,安装时需要在这个软件加上后缀.exe方可以执行安装

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

naca yu

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值