CVPR2021|基于分类深度分布网络的单目3D物体检测

该博客探讨了单目3D物体检测中的深度信息估计问题,指出显式和隐式学习深度的挑战,并提出了一种新的方法——分类深度分布网络(CADDN)。CADDN通过预测逐像素的分类深度分布,解决深度估计过度置信和特征拖尾效应,实现端到端3D物体检测。实验表明,CADDN在Kitti数据集上表现出色。
摘要由CSDN通过智能技术生成

1.要解决的问题

单目3D物体检测核心问题是如何准确估计物体的深度信息。已有方法尝试显式地或隐式地学习深度信息。

显式地学习存在的问题:1:深度估计的过度置信。一些方法[14,38,39,62]通过深度估计网络在一个单独阶段显式学习深度信息,但是后续的3D检测模块在没有考虑深度置信度的问题的情况下直接利用估计的深度图,会导致网络深度估计中的过度置信问题。2:非End-to-End。为了防止3D检测任务影响深度图的估计效果,3D检测模块与深度估计模块一般需要分开训练。

隐式地学习存在的问题:1:特征拖尾效应。[50,46]直接将特征从图像空间转换至3D空间,最后转换至鸟瞰角度,会导致特征拖尾效应(feature smearing effects,即3D投影空间中的多个位置会出现相似的图像特征),进而会增加物体定位难度。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

3D视觉工坊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值