【论文阅读】【三维目标检测】Pseudo-LiDAR from Visual Depth Estimation

2019年CVPR论文探讨了使用图像进行三维目标检测效果不佳的原因,指出问题在于前视图表示而非深度信息准确性。论文提出通过Depth Map恢复Pseudo LiDAR,结合图像和点云信息提升检测效果。实验表明,这种方法在某些场景下优于仅使用图像的检测方法,但仍不及激光雷达的精确度。
摘要由CSDN通过智能技术生成

2019CVPR

本文提出了一个重要观点:使用图像做三维目标检测,其效果差不是因为使用图像得到的深度信息不准确,而是因为使用前视图这种表示方式的问题

由于本文并未提出什么新的网络,所以这篇paper的解读与其他的结构不太一样。

检测结构

在这里插入图片描述
上图为本文提出的检测结构,整体分为两步走,第一步通过计算Depth Map,恢复出Pseudo LiDAR,第二部使用融合图像和点云的方法检测三维物体。

Depth Map -> Pseudo LiDAR:
在这里插入图片描述
说白了就是将深度图(u, v, d)的表示方式转为点云的表示方式(x, y, z)。

然后就是对Pseudo LiDAR的处理,就是丢掉一些超出一定x,y,z边界的点,例如高于激光雷达1m的点丢弃掉等。

对使用Pseudo LiDAR有效性的解释

这块内容主要是在Data representation matters这一节中讲的,其实我对这一节的解释很不认可。

首先先说一下文中的解释:
文中首先提到了convolution有两个假设:

  • local neighborhoods in
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值