稀疏卷积Sparse Convolution

瞻邈

已于 2024-05-17 20:22:47 修改

阅读量1.3k

点赞数 5

分类专栏： # 深度学习文章标签：深度学习计算机视觉 cnn

于 2024-02-28 21:25:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xhtchina/article/details/136356400

版权

深度学习专栏收录该内容

35 篇文章 1 订阅

订阅专栏

本文探讨了稀疏卷积在处理三维点云信号中的重要性，通过二维稀疏图像的实例解释其原理，包括输入定义、卷积核和两种输出定义。稀疏卷积旨在减少计算量，仅对活跃数据进行卷积操作，这对于点云深度学习有显著优势。

摘要由CSDN通过智能技术生成

1. 为什么提出稀疏卷积？它有什么好处？

卷积神经网络已经被证明对于二维图像信号处理是非常有效的。然而，对于三维点云信号，额外的维度显著增加了计算量。

另一方面，与普通图像每个像素都有值不同的是，一般情况下三维点云中多数空间都是空的，这使得三维体素中的点云数据通常是稀疏信号。

稀疏的2D image。其中深灰色像素全为零，浅灰色像素代表非零数据点

稀疏的3D grid

我们是否能只计算有效数据的卷积，而不是扫描所有的图像像素或空间体素？否则这些空白区域带来的计算量太多余了。这就是 sparse convolution 提出的motivation。

2. 稀疏卷积的原理

为了逐步解释稀疏卷积的概念，使其更易于理解，本文以二维稀疏图像处理为例。由于稀疏信号采用数据列表和索引列表表示，二维和三维稀疏信号没有本质区别。

2.1. 输入定义

使用以下稀疏图像作为输入

如图所示，我们有一个5×5的3通道图像。除了P1和P2两点外，所有像素都是空，我们称像P1和P2这样的非空点为active input site。

在稀疏格式中，数据列表是[[0.1,0.1,0.1], [0.2,0.2,0.2]]，索引列表是[1,2]，[2,3]，并且是YX顺序。

2.2. kernel定义

在卷积过程中卷积核如下定义，每个卷积核是一个3x3矩阵。深色和浅色代表两种滤镜。

2.3. 输出的定义

有两种稀疏卷积。

一种是 regular output definition，就像普通的卷积一样，只要kernel 覆盖一个 active input site，就可以计算出output site。

另一个称为submanifold output definition。只有当kernel的中心覆盖一个 active input site时，卷积输出才会被计算。

上图说明了这两种输出之间的区别。

A1代表 active site，即 P1产生的卷积结果。

类似地，A2代表从 P2计算出的 active site。A1A2代表 active site，它是 P1和 P2输出的总和。

深色和浅色代表不同的输出通道。

参考文献

通俗易懂的解释Sparse Convolution过程 - 知乎

点云深度学习-PointPillar_哔哩哔哩_bilibili

关注

5
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。