一文搞定3D卷积

Alex丶Chen

已于 2023-02-09 23:31:08 修改

阅读量3.1w

点赞数 75

分类专栏：视频理解文章标签：计算机视觉深度学习 cnn

于 2020-11-30 08:51:28 首次发布

本文链接：https://blog.csdn.net/njuptalex/article/details/110124538

版权

本文详细介绍了3D卷积的概念，包括3D卷积核的运动自由度和其在视频处理中的应用。此外，还探讨了卷积的分解方法，如空间可分离卷积和深度可分离卷积，以及它们在降低计算复杂性和参数量方面的优势。最后提到了S3D、(2+1)D、P3D和CSN等相关的卷积网络结构。

摘要由CSDN通过智能技术生成

一文搞定3D卷积

在讨论卷积核的时候，是不把channel维加进去的

核 = 一个可以滑动的窗口

窗口内不同位置数据之间的权值共享

3D卷积，卷积核会在3个方向上运动，那么卷积核的运动需要有三个自由度（一小块立方体，在一个大面包块内3个方向上滑动
2D卷积，卷积核只在2个方向上运动，因此只有两个自由度（一小片纸，在一大张纸内2个方向上滑动
1D卷积，卷积核只在1个方向上运动，因此只有一个自由度（一条滑窗，在一大长线上1个方向上滑动

一个卷积核运算一次得到一个输出值（先乘法再加法）

接下来考虑，卷积层如何进行计算，即将卷积核作用在多个输入通道上，又得到多个输出通道。

下图展示了CxHxW的输入特征，通过2D卷积层，得到1xHxW的输出特征的过程。

用pytorchAPI描述就是：

torch.nn.Conv2d(in_channels=C, out_channels=1, kernel_size=3, stride=1, padding=0, dilation=1, groups=1, bias=Falese, padding_mode='zeros', device=None, dtype=None)

该卷积层参数量为：输入通道数*输出通道数*kernel_size*kernel*size=

最低0.47元/天解锁文章

Alex丶Chen

关注

75
点赞
踩
282

收藏

觉得还不错? 一键收藏
12
评论
一文搞定3D卷积

在讨论卷积核的时候，是不把channel维加进去的核 = 一个可以滑动的窗口窗口内不同位置数据之间的权值共享3D卷积，卷积核会在3个方向上运动，那么卷积核的运动需要有三个自由度（一小块立方体，在一个大面包块内3个方向上滑动2D卷积，卷积核只在2个方向上运动，因此只有两个自由度（一小片纸，在一大张纸内2个方向上滑动1D卷积，卷积核只在1个方向上运动，因此只有一个自由度（一条滑窗，在一大长线上1个方向上滑动一个卷积核运算一次得到一个输出值以上讨论了单个卷积核，接下来考虑多通道，一个卷积核对应一
复制链接

扫一扫

专栏目录