【论文阅读】【三维目标检测】Pseudo-LiDAR from Visual Depth Estimation

最新推荐文章于 2024-08-20 08:31:25 发布

麒麒哈尔

最新推荐文章于 2024-08-20 08:31:25 发布

阅读量2.2k

点赞数 6

分类专栏：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wqwqqwqw1231/article/details/103300948

版权

2019年CVPR论文探讨了使用图像进行三维目标检测效果不佳的原因，指出问题在于前视图表示而非深度信息准确性。论文提出通过Depth Map恢复Pseudo LiDAR，结合图像和点云信息提升检测效果。实验表明，这种方法在某些场景下优于仅使用图像的检测方法，但仍不及激光雷达的精确度。

摘要由CSDN通过智能技术生成

文章目录

检测结构
对使用Pseudo LiDAR有效性的解释
实验

2019CVPR

本文提出了一个重要观点：使用图像做三维目标检测，其效果差不是因为使用图像得到的深度信息不准确，而是因为使用前视图这种表示方式的问题。

由于本文并未提出什么新的网络，所以这篇paper的解读与其他的结构不太一样。

检测结构

在这里插入图片描述
上图为本文提出的检测结构，整体分为两步走，第一步通过计算Depth Map，恢复出Pseudo LiDAR，第二部使用融合图像和点云的方法检测三维物体。

Depth Map -> Pseudo LiDAR：
在这里插入图片描述
说白了就是将深度图(u, v, d)的表示方式转为点云的表示方式(x, y, z)。

然后就是对Pseudo LiDAR的处理，就是丢掉一些超出一定x，y，z边界的点，例如高于激光雷达1m的点丢弃掉等。

对使用Pseudo LiDAR有效性的解释

这块内容主要是在Data representation matters这一节中讲的，其实我对这一节的解释很不认可。

首先先说一下文中的解释：
文中首先提到了convolution有两个假设：

local neighborhoods in

最低0.47元/天解锁文章

关注

6
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。