(2018, sensors) SECOND: Sparsely Embedded Convolutional Detection

最新推荐文章于 2024-09-03 22:57:13 发布

chaoqinyou

最新推荐文章于 2024-09-03 22:57:13 发布

阅读量153

点赞数

分类专栏：感知文章标签：深度学习人工智能目标检测 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chaoqinyou/article/details/129197837

版权

感知专栏收录该内容

19 篇文章 1 订阅

订阅专栏

paper: https://www.mdpi.com/1424-8220/18/10/3337

code: https://github.com/traveller59/second.pytorch

spconv: https://github.com/traveller59/spconv

pillar的方法算是为了速度在精度上的妥协，目前很多bev的方法还是用voxel的backbone，以SECOND为代表的voxel方向的方法非常值得一看。

一、创新点

用稀疏卷积处理3D信息，提高了训练和推理的速度，并提出了稀疏卷积的优化算法；

提出了一种新颖的angle loss的计算方法

提出了一种适用于点云数据的数据增强方法，提高了训练的收敛速度和模型的精度；

二、精度和速度

又快又好，精度基本上和image+lidar的方法一致

三、实现

3.1 网络结构

3.1.1 点云分组（体素化）

空间画3D格子，把每个点assign到格子格子里面；

3.1.2 单个体素特征提取（Voxelwise Feature Extractor, VFE）

详细说明参考voxel net，这部分的完整结构参考下面左图：每个voxel内，通过多个VFE layer后，用fcn过一遍然后做channel方向的max-pool形成这个体素的feature

单个VFE layer的结构如下面右图。

3.1.3 用稀疏卷积进行特征提取

稀疏卷积参考这个：https://zhuanlan.zhihu.com/p/382365889

middle layer 结构如下图

3.1.4 Region Proposal Network(RPN)

类似于SSD:

3.1.5 anchor的训练和训练target的产生

还是常规的assign的方式，根据iou确定是前景框/背景框/忽略框，然后产生一个相对的回归target:

3.2 训练和推理

3.2.1 loss

分类误差L_cls是focal loss

几何形状相关的误差是smoothL1, $\text{[math]}$ 角误差加了sin;

然后用方向误差L_dir是softmax, 用来区分 $\text{[math]}$ 是0和180°的情况；

3.2.2数据增强

复制黏贴，增加gt框和点云的数量，用碰撞测试去除物理上不可能的黏贴

单个物体上的噪声：逐个对gt框及其点云进行朝向和位置的抖动，使得网络适应

全局噪声：全局旋转并对尺度做缩放

四、重要参考文献

VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection

Spatially-sparse convolutional neural networks

Submanifold Sparse Convolutional Networks

3D Semantic Segmentation with Submanifold Sparse Convolutional Networks

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
(2018, sensors) SECOND: Sparsely Embedded Convolutional Detection

second论文阅读记录
复制链接

扫一扫

专栏目录

chaoqinyou CSDN认证博客专家 CSDN认证企业博客

码龄13年

42: 原创

12万+: 周排名

12万+: 总排名

4万+: 访问

: 等级

449: 积分

32: 粉丝

23: 获赞

13: 评论

141: 收藏

私信

关注

热门文章

分类专栏

最新评论

(2022 IV) RCBEV
sangba2019: 博主，你好。我看你分享的论文多是radar-camera feature级的融合，请问博主对前融合有研究么
stable diffusion webui 搭建和初步使用
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618243930。
论文阅读笔记：(2021.10 CoRL) DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries
K Ronaldo: 博主您好，关于这个论文我看了非常久，有一个问题一直弄不明白。就是他们的速度预测是怎么实现的呢？他们似乎完全没有用到时序信息
(2022.05) BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird‘s-Eye View Representation
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
(2019.01, iclr) Decoupled Weight Decay Regularization
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。