[pytorch][基础模块] torch.nn.Conv3D 使用样例与说明

最新推荐文章于 2025-04-28 16:07:48 发布

FrontierSetter

最新推荐文章于 2025-04-28 16:07:48 发布

阅读量3.2w

点赞数 36

CC 4.0 BY-SA版权

分类专栏： pytorch 文章标签： pytorch 3dconv 基础函数

本文链接：https://blog.csdn.net/FrontierSetter/article/details/99888787

pytorch 专栏收录该内容

1 篇文章

订阅专栏

本文详细解析了PyTorch中3D卷积层的使用方法，包括输入输出shape的解释、padding和stride的多维配置，以及通过实例演示如何进行3D卷积操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

torch.nn.Conv3D

3D卷积, 输入的shape是 $N, C_{in},D,H,W)$ ，输出shape $N,C_{out},D_{out},H_{out},W_{out})$

实际使用建议:
$N$ 就是batch_size，无话可说； $C_{in}$ 则对应着输入图像的通道数，如RGB\BGR图像这一维度就是3； $D$ 则是深度，如果是对于视频序列使用的3d conv，那么这个 $D$ 实际对应的就是要执行卷积的frame_size， $H, W$ 对应的就是输入图像的高和宽

另外，使用的时候如果不指定具体size，如:padding=2，则是每一维度都为size是2的padding，也就是padding=(2,2,2)；如果指定每一维的padding的话则有就是指定的size，如:padding=(3,2,1)，则是分别是在三个维度上有3,2,1三种不同的padding，另外kernel和stride也是如此

使用样例：

import torch
import torch.nn as nn

# Sample intput | 随机输入
net_input = torch.randn(32, 3, 10, 224, 224)

# With square kernels and equal stride | 所有维度同一个参数配置
conv = nn.Conv3d(3, 64, kernel_size=3, stride=2, padding=1)
net_output = conv(net_input)
print(net_output.shape)  # shape=[32, 64, 5, 112, 112] | 相当于每一个维度上的卷积核大小都是3，步长都是2，pad都是1

# non-square kernels and unequal stride and with padding | 每一维度不同参数配置
conv = nn.Conv3d(3, 64, (2, 3, 3), stride=(1, 2, 2), padding=(0, 1, 1))
net_output = conv(net_input)
print(net_output.shape) # shape=[32, 64, 9, 112, 112]