超详细的卷积后大小的计算公式

计算公式定义

定义几个参数

输入图片大小 W×W
卷积核大小 F×F
步长 S
padding的像素数 P
于是我们可以得出计算公式为:
N = (W − F + 2P )/S+1

输出图片大小为 N×N
以resnet50为例,输入为[1,3,224,224],其中1为batchsize,3为通道数,224为height和width。

经过第一层卷积后,其大小为[1,64,112,112]

in_channels= 3//输入通道
out_channels= 64 //输出通道
nn.Conv2d(in_channels, out_channels, kernel_size=7, stride=2, padding=3, bias=False)

N = (W − F + 2P )/S+1 = (224-7+2x3)/2 + 1 = 112

解释

1为batchsize,不改变。
对于通道数,会生成与设定的输出通道个数相同个数的卷积核,对图片进行卷积,即卷积核的个数等于输出特征图的通道数。
得到最终输出大小为[1,64,112,112]
(W − F + 2P )相当于计算除了第一次卷积后剩下的可用来卷积的大小
(W − F + 2P )/S为按照S大小的步长在刚刚得到的大小上可以向后移动多少次,即还可以做几次卷积
因为不包括第一次卷积,所以再加上一个1,
即N = (W − F + 2P )/S+1
输出大小 = (图片宽或高 - 卷积核大小 + padding大小)/ 步长 + 1
对于宽和高不同的图片可分别用上述公式计算,得到最终的输出大小。

卷积动态图解参考:
https://cs231n.github.io/assets/conv-demo/index.html

### 转置卷积层的输出尺寸计算 在 PyTorch 中,转置卷积层(也称为反卷积层或上采样层)用于增加特征图的空间维度。其输出大小取决于多个因素,包括输入张量的尺寸、内核大小、步幅、填充等。 对于二维转置卷积操作 `nn.ConvTranspose2d` 的输出尺寸可以通过下面给出的公式来预测: \[ H_{\text{out}} = (H_{\text{in}} - 1) \times \text{stride}[0] - 2 \times \text{padding}[0] + \text{dilation}[0] \times (\text{kernel\_size}[0] - 1) + \text{output\_padding}[0] + 1 \] \[ W_{\text{out}} = (W_{\text{in}} - 1) \times \text{stride}[1] - 2 \times \text{padding}[1] + \text{dilation}[1] \times (\text{kernel\_size}[1] - 1) + \text{output\_padding}[1] + 1 \][^3] 其中: - \( H_{\text{in}}, W_{\text{in}} \): 输入的高度和宽度; - stride, padding, dilation 和 kernel_size 是对应的超参数列表; - output_padding 参数允许调整输出形状,在某些情况下使它匹配预期目标。 为了更好地理解这些概念并验证上述公式的准确性,可以创建一个简单的例子来进行测试。这里展示了一个 Python 函数,该函数接受必要的参数作为输入,并返回预计的输出高度和宽度。 ```python def get_transpose_conv_output_shape(input_h_w, out_channels, in_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, dilation=1): """ 计算给定配置下的 nn.ConvTranspose2d 输出 shape :param input_h_w: tuple(int,int), 输入图像高宽 :return: tuple(int,int),输出图像高宽 """ h_in, w_in = input_h_w k_h, k_w = kernel_size if isinstance(kernel_size, tuple) else (kernel_size,) * 2 s_h, s_w = stride if isinstance(stride, tuple) else (stride,) * 2 p_h, p_w = padding if isinstance(padding, tuple) else (padding,) * 2 op_h, op_w = output_padding if isinstance(output_padding, tuple) else (output_padding,) * 2 d_h, d_w = dilation if isinstance(dilation, tuple) else (dilation,) * 2 height_out = ((h_in - 1) * s_h - 2 * p_h + d_h * (k_h - 1) + op_h + 1) width_out = ((w_in - 1) * s_w - 2 * p_w + d_w * (k_w - 1) + op_w + 1) return height_out, width_out # 测试案例 input_height_width = (6, 6) conv_t_params = { 'out_channels': 8, 'in_channels': 4, 'kernel_size': 3, 'stride': 2, 'padding': 1, 'output_padding': 1, } print(get_transpose_conv_output_shape( input_height_width, **conv_t_params)) ``` 此代码片段定义了辅助函数 `get_transpose_conv_output_shape()` 来帮助用户快速估算特定条件下转置卷积后的输出尺寸。
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值