pytorch中的torch.nn.Unfold和torch.nn.Fold

pytorch中的torch.nn.Unfold和torch.nn.Fold

目的

平时使用卷积操作时,既卷积核滑动窗口操作,对于pytorch,以二维图像为例,调用nn.Conv2d就能完成对输入(feature maps)的卷积操作。
但有时,maybe要探究卷积核对应的某一channel的单个窗口的卷积操作,或显式地进行卷积操作。此时,就需要nn.Unfold和nn.Fold。前段时间引起较大争议的BagNet(Bag of local feature net) 的分块卷积操作既由此函数完成。
一般来说,Conv2d 就是 Unfold + matmul + fold

Unfold

torch.nn.Unfold按照官方的说法,既从一个batch的样本中,提取出滑动的局部区域块,也就是卷积操作中的提取kernel filter对应的滑动窗口。
滑动窗口
如上图所示,蓝色框部分就是kernel filter(红色框部分)对应的滑动窗口。
首先来看下torch.nn.Unfold的参数:

torch.nn.Unfold(kernel_size, dilation=1, padding=0, stride=1)

跟nn.Conv2d的参数很相似,卷积核的尺寸,空洞大小,填充大小和步长。

官方解释中:unfold的输入为( N N N, C C C, H H H, W W W),其中N为batch_size,C是channel个数,H和W分别是channel的长宽。则unfold的输出为( N N N, C × ∏ C \times \prod C×(kernel_size), L L L),其中 ∏ \prod (kernel_size)为kernel_size长和宽的乘积, L是channel的长宽根据kernel_size的长宽滑动裁剪后,得到的区块的数量。

以输入(1, 3, 4, 4)为例,设定kernel_size = (2, 2),stride = 2,根据官方给出的 L L L计算公式: L = ∏ d ⌊ s p a t i a l _ s i z e [ d ] + 2 × p

  • 17
    点赞
  • 68
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
PyTorch是一个基于Python的科学计算库,主要针对深度学习任务。在PyTorchtorch.nn是一个用于构建神经网络模型的模块。 torch.nn模块提供了一系列神经网络层和函数,方便用户构建自定义的神经网络。用户可以通过继承torch.nn.Module类来定义自己的神经网络模型。torch.nn模块常用的类包括各种层(例如全连接层、卷积层、池化层和循环层等)、非线性激活函数和损失函数等。 在使用torch.nn模块构建神经网络时,用户需要实现模型的前向传播函数forward()。该函数定义了输入数据在神经网络的流动方式,即通过层和函数的组合计算输出。在forward()函数,用户可以使用已定义的层和函数进行计算,也可以实现自定义的操作。 torch.nn模块的另一个重要概念是参数(parameter)。参数是模型需要学习的变量,例如网络层的权重和偏置项。用户可以通过在模型定义torch.nn.Parameter对象来创建参数,并在forward()函数进行使用。 除了torch.nn模块外,PyTorch还提供了其他的工具和模块来辅助神经网络的训练和优化过程。例如torch.optim模块包含了各种优化算法,如随机梯度下降(SGD)、Adam等,用于更新模型的参数。torch.utils.data模块提供了数据处理和加载的工具,方便用户使用自己的数据训练模型。 总之,torch.nn模块是PyTorch用于构建神经网络模型的重要组成部分。通过使用torch.nn的各种类和函数,用户可以方便地创建自己想要的神经网络结构,并利用PyTorch强大的计算能力和优化算法来训练和优化模型。
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值