3D 目标检测综述梳理图解

最新推荐文章于 2024-07-29 10:09:20 发布

木木阳

最新推荐文章于 2024-07-29 10:09:20 发布

阅读量1k

点赞数 3

分类专栏：目标检测 3D 文章标签：目标检测计算机视觉 3d

本文链接：https://blog.csdn.net/weixin_44287798/article/details/126938425

版权

2 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

由于传不了pdf，本人就直接传图片吧
请添加图片描述

请添加图片描述
梳理：

这一部分的内容主要是在不同view的一个fusion，从早期的三个channel到目前的两个channel，可见BEV&Image FV较为重要。
其次我们一直采用点云的 BEV来进行fusion，那么有没有一种可能，Image 也具有一定的BEV信息？
结论：个人认为是有的，无论是之前的传统摄像头采用桶型矫正&梯形校正，从而获得的BEV，还是GAN得到的结果，都说明Image存在一定的BEV信息，但是可能由于数据集采样方式(摄像头参数高度场景不一样)不一致，导致最后无法得到一个确定的参数来拿到传统的校正表
猜想：是否可以从每张图片获取相关的校正参数信息，如果这样的，采用少量的数据集进行校准，是不是可以得到一个被提前计算得到的校准表，从而达到节省计算的操作有人做了

请添加图片描述

请添加图片描述

局限性：这种方法很明显会受限于2D检测的精度，如果遇见小目标、困难样本以及遮挡问题点云的优势反而会被限制容易陷入1+1 < 1的窘境当中
进一步思考：3D检测【点云】本身有不局限于光照的优点，但是采用这种方式很明显会受制于这个问题，从后续的文章可见即使缺少RGB通道的信息，3D检测的精度也能够达到较高。这可能是由于数据集的场景决定的，比如不会出现两种近似的物种出现【比如猫、老虎幼崽】，而在真正的场景中，可能需要加上unknown的对象，以面对开放场景的问题【其实数据集里都会对应don’t care等】

请添加图片描述

重点：如何减少无用运算增加有效运算
方式：1、先提出一个较好的网络模型，这个时候不用太关心其速度，但是需要注重他的性能。2、性能达到目标时，可以针对模型中的各个模块进行耗时测速，以及分析该模块是否合理以及能否采用更好的模块进行替换。3、针对替换后的模块进行相应的调优。
PV-RCNN -> PV-RCNN++ & 3DSSD也是如此