STD: Sparse-to-Dense 3D Object Detector for Point Cloud 阅读笔记

最新推荐文章于 2022-04-14 10:35:18 发布

RRRRRRian

最新推荐文章于 2022-04-14 10:35:18 发布

阅读量273

点赞数

文章标签：计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/github_38763455/article/details/112554515

版权

Proposal生成

球形Anchor

STD方法使用球形Anchor，不同的检测目标使用不同的球半径。因为球形Anchor没有方向，网络后期直接预测角度，所以Anchor的数量比传统的带方向的长方体Ancho少了50%减少到了16K左右，通过NMS方式（IoU是BEV投影上的）删除冗余的Anchor最终减少到500个左右。且球形Anchor比传统Anchor拥有更高的recall。

proposal 生成网络

在每个Anchor中收集点，输入PointNet进行分类前景、背景。
然后计算Anchor的中心偏移量和预定义大小的偏移量，对Anchor进行精修。
角度回归方面：定义了 $N_a$ 个角度箱子(angle bins)。残差值根据bin的值进行回归。(实验中 $N_a=12$ )。
使用基于分类评分的NMS和面向BEV的IoU来消除冗余的proposals。在训练期间保留多达300个proposals，在测试期间保留100个proposals。

Anchor 类别定义

因为球形Anchor与传统Anchor不同，所以作者提出了一种新的方式——PointsIoU，使用两个区域相交区域内的点数与两个区域联合区域内的点数的商。 $> 0.55$ 则为前景，否则为背景。

Proposal特征提取

动机

在这里插入图片描述
因为效率的问题使用PointsPool 和 FC 替代了Point++中的3个SA模块，同时又有很好的效果。

PointsPool 层

总共分三个步骤：

在每个Proposal中选取N个点。每个点减去Proposal的中心并做刚性旋转到规范的位置下。
将Proposal体素化，每个体素中采样 $N_r=35$ 个点。体素特征包括点的标准坐标特征和语义特征。
使用VoxelNet中的VFE来抽取特征。

Box 预测网络

Box估计部分

使用两个FC层(通道数为(512,512))来抽取每个proposal的特征。
使用另外两个FC层来进行分类和回归预测。直接预测ground truth和proposal的偏移量 $t_l,t_w,t_h)$ 和中心偏移 $t_x,t_y,t_z)$

IoU估计部分

TODO

损失函数

TODO

实验部分

TODO

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。