【论文阅读】【3d目标检测】FAST pointrcnn

论文标题:Fast Point R-CNN

还是记录。。。
这篇文章后面与voxelnet进行了fps对比,究竟快在哪里,究竟为啥ap提升了?是本文想要探讨的东西。
在这里插入图片描述
文章的思路很简单,分为两个阶段

第一阶段

考虑到pointnet类似的方法需要对于整个点云进行编码,计算量极大,而一些由2d生成proposals的方法又极度依赖于2d目标检测的效果,所以作者采用了voxel的形式进行VFE编码。不了解VFE的朋友可以先看看voxelnet
作者发现每个格子中采用6个点,依赖8channel的mlp可以提取到不错的feature,于是采用这个超参数进行feature编码。得到voxel图,最后进行rpn设计:
在这里插入图片描述

第二阶段

对于第一阶段提取出来的proposals,利用其在rpn中的特征,做一个注意力机制,与原始点云编码后的信息进行相乘,这里主要是用rpn中的feature完成注意力设计。
在这里插入图片描述

思考

在这里插入图片描述

快在哪?
我觉得文章快在对于数据的处理,作者这里每个voxel只取六个点,而且没有叠加很多的vfe层,仅仅采用一个6channel的mlp进行特征的提取。

好在哪?
首先可以看到rpn的结果就已经比voxelnet好了,在我看来这得益于3d卷积操作,对于全局特征进行了一个更好的融合。
其次作者引入的注意力机制,让proposal对于local feature有了一个更好的融合。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值