填充与步幅对卷积层形状的作用

填充和步幅

一般来说,假设输入形状是 n h × n w n_h\times n_w nh×nw,卷积核窗口形状是 k h × k w k_h\times k_w kh×kw,那么输出形状将会是

( n h − k h + 1 ) × ( n w − k w + 1 ) . (n_h-k_h+1) \times (n_w-k_w+1). (nhkh+1)×(nwkw+1).

所以卷积层的输出形状由输入形状和卷积核窗口形状决定。填充和步幅。它们可以对给定形状的输入和卷积核改变输出形状

填充

填充(padding)是指在输入高和宽的两侧填充元素(通常是0元素)。下图里我们在原输入高和宽的两侧分别添加了值为0的元素,使得输入高和宽从3变成了5,并导致输出高和宽由2增加到4。 0 × 0 + 0 × 1 + 0 × 2 + 0 × 3 = 0 0\times0+0\times1+0\times2+0\times3=0 0×0+0×1+0×2+0×3=0

在这里插入图片描述

一般来说,如果在高的两侧一共填充 p h p_h ph行,在宽的两侧一共填充 p w p_w

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PyTorch中的卷积层是神经网络中常用的一种层类型,用于处理图像和其他多维数据。卷积层通过对输入数据进行卷积操作来提取特征,并生成输出特征图。卷积操作是指将一个滤波器(也称为卷积核)与输入数据进行逐元素相乘,并将结果相加得到输出特征图的过程。[1] 在PyTorch中,卷积层的相关参数包括输入通道数、输出通道数、卷积核大小、步长和边缘填充等。输入通道数指的是输入数据的通道数,例如RGB图像的通道数为3。输出通道数指的是卷积层输出的特征图的通道数,通常可以理解为卷积核的个数。卷积核大小指的是卷积核的尺寸,例如3x3的卷积核。步长指的是卷积操作在输入数据上滑动的步长,用于控制输出特征图的尺寸。边缘填充是指在输入数据的边缘周围填充额外的像素,以保持输出特征图的尺寸与输入数据相同。[2] 在使用PyTorch的卷积层时,可以通过定义一个继承自`nn.Module`的神经网络类,并在其中定义卷积层的相关参数来创建卷积层。例如,可以使用`nn.Conv2d`类来定义一个二维卷积层,并指定输入通道数、输出通道数、卷积核大小、步长和边缘填充等参数。然后,在神经网络的前向传播方法中,可以通过调用卷积层的`forward`方法来进行卷积操作,并返回输出特征图。[3] 总结起来,PyTorch中的卷积层是用于处理图像和其他多维数据的一种神经网络层类型。它通过卷积操作来提取特征,并生成输出特征图。在使用PyTorch的卷积层时,需要定义相关参数,并在神经网络的前向传播方法中调用卷积层进行卷积操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值