【论文阅读】【3d目标检测】CIA-SSD

最新推荐文章于 2024-01-25 16:08:31 发布

Lukas88664

最新推荐文章于 2024-01-25 16:08:31 发布

阅读量2.1k

点赞数

分类专栏：论文阅读文章标签：目标检测人工智能计算机视觉深度学习算法

本文链接：https://blog.csdn.net/hgj1h/article/details/123945672

版权

论文阅读专栏收录该内容

37 篇文章

订阅专栏

该论文提出了一种名为CIA-SSD的3D目标检测器，它在点云数据上实现快速且准确的检测。方法包括体素编码、SSFA模块和IoU感知的NMS策略。SSFA模块通过两组卷积增强特征，而IoU-Aware Confidence解决了NMS中置信度和IoU不匹配的问题。在训练时分开预测，推理时结合使用，优化了检测效果。尽管体素化过程可能丢失一些信息，但整体框架表现出良好的性能和效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文标题：CIA-SSD: Confident IoU-Aware Single-Stage Object Detector From Point Cloud

2021AAAI 香港中文大学出品
达到了不错的ap，速度也挺快的。
在这里插入图片描述
老规矩，上图！

文章框架很明了，主要是进行了三步操作：

首先是encode

利用second的框架，首先对于原始点云进行voxel化，随后ssc卷积生成dense feature map 这个dense是针对于z方向而言的。生成BEV feature map后输入到ssfa模块。

SSFA

SSFA模块分为两个group，对于spatial group，我们保持维度不变，进行卷积，使得feature的感受野变大。
对于semantic group 作者指出为了得到更高维的信息，进行一个spatial维度的降低，同时增大feature
的channel。
最后利用deconv恢复semantic group的feature维度。一支输送到spatial group将两个group的feature进行concat拼接。
另一分支则进行两个group的特征融合：
在这里插入图片描述

引入了自注意力机制。

随后对于得到的feature map执行多任务

head

为了消除confidence和iou预测值两者不匹配的问题，作者提出了一个新的辅助变量： IoU-Aware Confidence
主要思想就是原来的nms依靠于confidence，而作者通过实验发现预测出来的iou是有判别力的：
在这里插入图片描述
为了让预测出来iou较高的bbox能contribute更多，作者引入了一个超参数β，
随后与class score进行相乘，用这个数来进行nms操作。
这样做的好处是：让使得iou高与低的bbox的效果得到极化。
在训练过程中 iou与class score的预测分开来训练，只有推理的时候采用f来进行nms操作。