rcnn论文_三维目标检测论文阅读：PI-RCNN

最新推荐文章于 2022-11-01 10:05:23 发布

weixin_39880615

最新推荐文章于 2022-11-01 10:05:23 发布

阅读量402

点赞数

文章标签： rcnn论文 unet论文

题目：PI-RCNN: An Efficient Multi-sensor 3D Object Detector with Point-based Attentive Cont-conv Fusion Module

发表会议：AAAI2020

论文链接： https://arxiv.org/pdf/1911.06084

发表单位：浙江大学，阿里巴巴， Fabu Inc

简介：主要提出 Point based Attentive Cont-conv Fusion(PACF) 模块包括 Continuous Convolution, Point-Pooling 和 Attentive Aggregation等组件，实现三维激光数据和图像的融合

Motivation

由于Continuous convolution的缺点：BEV-format quantifies the 3D world into a pseudo image, so the neighbors search and fusion on BEV map suffers from the loss of precision（由于在融合图像和点云时，点云以俯视图形式表征，这会带来量化误及最近邻搜索引起的误差），因此本文将图像的语义特征和点云的原始点进行融合

Method

一、网络总体框架

图像语义分割网络获得图像的语义特征
检测子网络-1 从原始点云中得到目标的三维候选框
PACF模块融合点云特征和图像语义特征
检测子网络-2 得到最终的三维检测结果

该网络在训练的过程中首先训练语义分割网络，然后固定语义分割网络参数训练三维目标检测网络

二、PACF模块具体示意图

1）对于点云上的每一个点搜索K个近邻点

2）根据标定参数，将K个近邻点投影到语义分割特征图上

3）将检索得到的图像语义特征、学习得到的点云特征和点云位置关系串联

4）利用attentive continuous convolution融合3）中的串联特征

5）将3）中的串联特征Pooling并与4）得到的特征串行连接

Experiments

在KITTI测试集上的训练结果，语义分割网络使用的是UNet，三维目标检测网络使用的是PointRCNN

Ablation Study

1、最近邻点数的选择 K=3更佳

2、选择原始的激光特征or选择网络中间层的激光特征：选择网络中间层的激光特征更佳

3、输入语义特征的维度：多维更佳

4、预训练语义分割网络or端到端训练：预训练语义分割网络更佳

weixin_39880615

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
rcnn论文_三维目标检测论文阅读：PI-RCNN

题目：PI-RCNN: An Efficient Multi-sensor 3D Object Detector with Point-based Attentive Cont-conv Fusion Module发表会议：AAAI2020论文链接： https://arxiv.org/pdf/1911.06084发表单位：浙江大学，阿里巴巴， Fabu Inc简介：主要提出 Point base...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。