《动手学深度学习》(PyTorch版)代码注释 - 19【Padding&Stride】

最新推荐文章于 2024-07-10 19:09:07 发布

Hurri_cane

最新推荐文章于 2024-07-10 19:09:07 发布

阅读量223

点赞数

分类专栏：《动手学深度学习》(PyTorch版)代码注释文章标签：卷积 python 深度学习人工智能 PyCharm

本文链接：https://blog.csdn.net/ShakalakaPHD/article/details/108187644

版权

《动手学深度学习》(PyTorch版)代码注释专栏收录该内容

56 篇文章 45 订阅

订阅专栏

说明

本博客代码来自开源项目：《动手学深度学习》(PyTorch版)
并且在博主学习的理解上对代码进行了大量注释，方便理解各个函数的原理和用途

配置环境

使用环境：python3.8
平台：Windows10
IDE：PyCharm

此节说明

此节对应书本上5.2节
此节功能为：填充和步幅
由于次节相对容易理解，代码注释量较少

代码

# 本书链接https://tangshusen.me/Dive-into-DL-PyTorch/#/chapter03_DL-basics/3.8_mlp
# 5.2 填充和步幅
#注释：黄文俊
#邮箱：hurri_cane@qq.com

import torch
from torch import nn



# 定义一个函数来计算卷积层。它对输入和输出做相应的升维和降维
def comp_conv2d(conv2d, X):
    # (1, 1)代表批量大小和通道数（“多输入通道和多输出通道”一节将介绍）均为1
    X = X.view((1, 1) + X.shape)
    Y = conv2d(X)
    return Y.view(Y.shape[2:])  # 排除不关心的前两维：批量和通道

# 注意这里是两侧分别填充1行或列，所以在两侧一共填充2行或列
conv2d = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=3, padding=1)
# padding=1表示高度方向和宽度方向均填充了，其等价于padding=（1,1）

X = torch.rand(8, 8)
print(comp_conv2d(conv2d, X).shape)

# 使用高为5、宽为3的卷积核。在高和宽两侧的填充数分别为2和1
conv2d = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=(5, 3), padding=(2, 1))
print(comp_conv2d(conv2d, X).shape)

# 令高和宽上的步幅均为2，从而使输入的高和宽减半。
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride=2)
print(comp_conv2d(conv2d, X).shape)

# 稍复杂的例子
conv2d = nn.Conv2d(1, 1, kernel_size=(3, 5), padding=(0, 1), stride=(3, 4))
print(comp_conv2d(conv2d, X).shape)
# 这个复杂的例子中，其实高和宽都没有被整除，高方向上剩了2行；宽方向上剩了1列
# 将步长改为（4,5），输出的shape还是torch.Size([2, 2])



print("*"*50)