【CVPR2022】ST-MVDNet:Modality-Agnostic Learning for Radar-Lidar Fusion in Vehicle Detection论文阅读分析与总结

Challenge:

之前的研究都是在假设模型总是可以访问两个无错误传感器输入的情况下,MVDNet多模态输入模型其中一个传感器不可用或丢失,模型可能会寄。
在这里插入图片描述
而直接屏蔽一个输入流的强数据增强,将使模型依赖于一个清晰的蒸汽而忽略缺失的流,直接随机缺失传感器训练的模型不能有效地融合两个传感器的两个特征。模型学习更多的是每个模态单独工作,以便即使缺少一个传感器,它也能够生成预测。
在这里插入图片描述

Contribution:

1.提出了一个基于 Mean Teacher 的框架,利用强传感器缺失数据增强来解决缺失传感器的问题。
2.开发的模型不仅能够处理噪声/缺失传感器,而且能够在多个实验设置的ORR数据集上大大优于现有的最先进的(5%)。

Method:

学生模型接受激光雷达数据雾化增强、强缺失雷达增强和强缺失激光雷达增强,使用Mean teachers,定义一致性损失与强增强损失知识蒸馏学习,使一个缺失传感器的学生模型获得与清晰传感器教师模型一致的输出。
在这里插入图片描述

Lconsist

在这里插入图片描述
(没有对边界框回归应用损失,不太懂?)
使用教师模型对学生模型进行正则化。

Lstrong

在这里插入图片描述
n表示缺失的传感器输入
通过强制学生单一清晰模态的预测结果靠近两种清晰模态教师的预测结果,训练模型从缺失的模态中恢复特征以生成更好的检测,而不是学习模态之间独立预测。

Experiments:

直接性能比较,未缺失的情况下很大一部分性能应该来自于Self-training提高的泛化能力。
在这里插入图片描述
缺失传感器数据性能比较
在这里插入图片描述
模块消融:Lstrong的性能提升最大,Lconsist作为正则化有略微提升(本身也缺少回归loss)。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值