李沐之卷积层里的填充和步幅

目录

1.填充和步幅

2.代码实现

2.1 填充

2.2 步幅


1.填充和步幅

每一层都减少4,经过7层就减少28,32-28=4。如果不想让输出减小可以采取的方法就是填充。

通常会选择填充的行数和列数分别为核的行数列数减1。这样做的好处就是代进去消去输出的形状就和原来的形状相同。偶数的卷积和就上侧填多一行,下侧填少一行,反过来同样可以。

输出的大小和层数是线性相关的,那么步幅可以让他变成指数相关。

2.代码实现

2.1 填充

#创建一个高度和宽度为3的二维卷积层,并在所有侧边填充1个像素。给定高度和宽度为8的输入,
#则输出的高度和宽度也是8。
import torch
from torch import nn

# 为了方便起见,我们定义了一个计算卷积层的函数。
# 此函数初始化卷积层权重,并对输入和输出提高和缩减相应的维数
def comp_conv2d(conv2d,X):
    X=X.reshape((1,1)+X.shape)
    # 这里的(1,1)表示批量大小和通道数都是1,"+"起到连接两个列表的作用
    Y=conv2d(X)
    return Y.reshape(Y.shape[2:])
    # 省略前两个维度:批量大小和通道

conv2d=nn.Conv2d(1,1,kernel_size=3,padding=1)
# 请注意,这里每边都填充了1行或1列,因此总共添加了2行或2列
X=torch.rand(size=(8,8))
comp_conv2d(conv2d,X).shape
"""结果输出:
torch.Size([8, 8])
"""
#因为核的大小为3*3,为奇数,通常填充3-1=2,因为核为奇数,填充为1指的是上下左右填充2/2=1。
#所以上下填充了2,左右填充了2,最后输出的大小就是(8-3+2+1)*(8-3+2+1)=(8,8)

#当卷积核的高度和宽度不同时,我们可以填充不同的高度和宽度,使输出和输入具有相同的高度和宽度。
#在如下示例中,我们使用高度为5,宽度为3的卷积核,高度和宽度两边的填充分别为2和1。
conv2d=nn.Conv2d(1,1,kernel_size=(5,3),padding=(2,1))
"""结果输出:
torch.Size([8, 8])"""
#因为填充的是(2,1),所以总上下填充4,左右填充2,则(8-5+4+1)*(8-3+2+1)=(8,8)

    

第二个不规则的填充也可以这样计算:

2.2 步幅

conv2d=nn.Conv2d(1,1,kernel_size=3,padding=1,stride=2)
"""结果输出:
torch.Size([4,4])"""
#没有步幅的时候,维度是(8,8),高宽都能被2整除,因此输出为(8/2,8/2)=(4,4)
#[(8-3+2+2)/2,(8-3+2+2)/2]=[4.5,4.5]向下取整[4,4]

conv2d=nn.Conv2d(1,1,kernel_size=(3,5),padding=(0,1),stride=(3,4))
comp_conv2d(conv2d,X).shape
"""结果输出:
torch.Size([2, 2])
"""
#[(8-3+0+3)/3,(8-5+2+4)/4]=[2.66,2.25]向下取整[2,2]

参考:

Python中的连接符(+、+=)示例详解 - Python技术站

Pytorch的nn.Conv2d()详解-CSDN博客

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值