【Paper Reading-3D Detection】Fully Convolutional One-Stage 3D Object Detection on LiDAR Range Images

URL

https://arxiv.org/pdf/2205.13764.pdf

TL;DR

FCOS-LiDAR: Fully Convolutional One-Stage 3D Object Detection on LiDAR Range Images
本文主要提出了lidar-based 的Range View视角下的3D目标检测方法。
主要亮点:

  • range view, 只使用标准卷积;
  • 在range view,使用了多帧,并且优化方法能有一个比较好的效果;
  • Modality-wise Convolutions:通道重新排列;
  • 检测头不共享权重;

Dataset/Algorithm/Model/Experiment Detail

网络主体跟模仿FCOS,(其实跟FCOS3D差不多),很多工作在前处理部分,在怎么得到range view image上。
笛卡尔坐标系投影到球坐标系跟其他做法差别不大。
Multi-round Range View Projection
作者发现多帧稠密化之后,range view下有很多的点碰撞,到最后有90%的点被丢弃,导致稠密化之后抽帧效果跟单帧差别不大。作者采用多次(5次效果最好)投影的方式,得到新的 range view image;

Modality-wise Convolutions
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HPgjx4Pg-1655108238567)(upload://tkyTfmlAkhefI0SrhpSYzT3M1SF.png)]

主要思路是把 [x,y,z] , [r,θ,φ] , [i] , [e] and [t] 这几个类型的通道按相同类型的放一起;实验结果如下:mAP涨点0.6~0.7,NDS涨点不多;
在这里插入图片描述

Untied Weights of Detection Heads
这里有一点比较有趣检测头不共享权重,image-based方法共享权重效果比较好;
在这里插入图片描述

整体网络:
在这里插入图片描述

大致跟FCOS3D挺像,backbone有不少修改比如: VR分辨率低减少下采样,使用空洞卷积,ResNet-50 four stages数量更改 (3,4,6,3) --> (4,4,1,1)等。

Experiment

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Nuscenes test上效果比centerpoint好
在这里插入图片描述

Thoughts

在bev-based方法火热的情况下,出现了一篇range view的方法并且效果还不错,近期range view的工作确实比较少,上次比较有印象的还是RangeDet。
这篇文章的一个目的也是为了避免使用3D卷积,3D稀疏卷积。还把multi frame用上了并且用好了,感觉这一块还能深挖一下。
然后检测头不共享权重似乎也可以深挖一下。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

烤粽子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值