论文阅读:Boosting 3D Object Detection by Simulating Multimodality on Point Clouds

Boosting 3D Object Detection by Simulating Multimodality on Point Clouds


在这里插入图片描述
稠密(多模态、多帧)信息->稀疏(单模态点云,单帧)信息的知识蒸馏:
模型在稠密信息中的精度高作teacher提升稀疏信息下的精度,具体包括4重蒸馏:

Response Distillation

利用多模态Response中的知识,根据设计的关键响应挖掘来纠正单模态响应,以便将蒸馏集中在对精度计算至关重要的响应上。
通过heatmap设定相应策略求得TP,FP,FN:
hs表示SSD的heatmap,hg表示groundtruth的heatmap
在这里插入图片描述
随后根据正确的预测(TP)与错误的预测(FP,FN)进行加权的分类响应蒸馏(错误分类的权重更大):
在这里插入图片描述
以及在TP,FN上为每个框设权值做加权定位回归响应蒸馏:
(由于图像特征提供了清晰的对象边界,多模态 SSD 在某些属性(例如大小)中可以更准确地预测边界框)
在这里插入图片描述

Sparse-Voxel Distillation

将挖掘策略从Response扩展到体素,对体素特征和关系制定一致性约束,从多模态SSD到单模态SSD中提取关键体素中的语义和关系知识。
通过探索最后一个稀疏卷积层中的体素特征来进一步增强单模态 SSD。该层具有丰富的语义并保留原始的 3D 空间信息。与响应蒸馏相比,稀疏体素蒸馏可以更好地提高单模态和多模态 SSD 中高维特征之间的一致性
背景特征主导了蒸馏,阻碍了前景知识转移,而且计算大量体素非常耗时且耗时。
在这里插入图片描述
利用相应建立非空体素。进行体素的特征蒸馏与关系(体素之间的余弦相似性)蒸馏:
在这里插入图片描述
在这里插入图片描述

Voxel-to-Point Distillation

通过将粗粒度体素特征转换为细粒度点特征,以点的方式提取细粒度特征来模拟稀疏点或小尺寸对象的细粒度特征。
通过相邻体素特征插值为前景点计算出点级特征:
在这里插入图片描述
fv为点p的相邻体素,pv为体素中心坐标。
与体素蒸馏相似,进行特征与关系蒸馏:
在这里插入图片描述
在这里插入图片描述

Instance Distillation

通过学习NMS过滤的边界框中的深层BEV特征来纠正单模态预测。
在BEV特征层面,首先使用NMS去除冗余框,使用rotated RoI-grid pooling得到5x5的RoI特征并进行蒸馏。
在这里插入图片描述

loss

在这里插入图片描述

Experiments

在nuScenes测试集上仅SOTA LiDAR检测器:
在这里插入图片描述

30%训练数据在nuScenes验证集上消融实验:
在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值