深度学习笔记 —— 卷积层里的填充和步幅

Whisper_yl

已于 2022-04-14 20:44:17 修改

阅读量1.1k

点赞数

分类专栏： # 深度学习

于 2022-04-14 20:43:49 首次发布

本文链接：https://blog.csdn.net/lightindarkness/article/details/124180106

版权

卷积神经网络填充步幅尺寸保持 PyTorch

关键词由CSDN通过智能技术生成

深度学习专栏收录该内容

23 篇文章 10 订阅

订阅专栏

有时候，如果输入图像的尺寸比较小，那么通过几层卷积之后尺寸就不能够支持继续做卷积了，从了限制了网络的深度

填充通常设置成kernel_size - 1，以保持输入输出尺寸一致，算起来比较方便

import torch
from torch import nn


def comp_conv2d(conv2d, X):
    # 在维度的前面加入一个通道数和批量大小数
    X = X.reshape((1, 1) + X.shape)
    Y = conv2d(X)
    return Y.reshape(Y.shape[2:])


# 在所有侧边填充一个像素
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1)
X = torch.rand(size=(8, 8))
print(comp_conv2d(conv2d, X).shape)

# 填充不同的高度和宽度
conv2d = nn.Conv2d(1, 1, kernel_size=(5, 3), padding=(2, 1))  # 上下填充2，左右填充1
print(comp_conv2d(conv2d, X).shape)

# 将高度和宽度的步幅设置为2
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride=2)
print(comp_conv2d(conv2d, X).shape)

# 一个稍微复杂的例子
conv2d = nn.Conv2d(1, 1, kernel_size=(3, 5), padding=(0, 1), stride=(3, 4))
print(comp_conv2d(conv2d, X).shape)