激光雷达和视觉融合的3D目标检测算法(二)

paper发表地方代码链接Nuscenes_test(NDS)Nuscenes_val(NDS)备注
DistillBEVICCV2023pytorch代码0.6120.547蒸馏学习
MetaBEVICCV2023pytorch代码-69.8模态缺失,对齐
UniBEVICCV2023--58.7(avg(L+C,L,C))模态缺失,对齐
CMTICCV2023pytorch代码0.7410.729对齐,训练时模态缺失
GraphAlignICCV2023-0.706-对齐

模态缺失:当某个模态的数据缺失的时候(没有图像或者Lidar数据)模型仍然可以处理,在进行训练的时候对于多模态的数据随机缺失。
对齐:在设计模型的时候考虑利用某种方法来对齐两个模态的数据。(MetaBEV和UniBEV都是通过BEVQuery来达到对齐的目的,只是Query使用的位置不同,CMT由于使用的是PETR中图像到BEV空间的转换,图像特征不是BEV类型的(hwc),因此设计了一种共享编码来达到隐式对齐的目的),GraphAlign中通过利用与自己相近的K个激光雷达点以及对应位置的k个图像特征点拼接后构成融合特征,之后利用Self-attentino来对该融合特征进行进一步融合,对该k个特征进行自适应融合。原来是一对一的来进行融合,现在相当于进行多对一,通过提高冗余性来间接达到对齐的目的。
蒸馏学习:用于Lidar的特征对图像特征进行蒸馏,使得图像特征学到包含几何信息来更好地分类和回归

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值