【torch】torch.nn.functional 中的unfold和fold直观理解

every blog every motto: There’s only one corner of the universe you can be sure of improving, and that’s your own self.
https://blog.csdn.net/weixin_39190382?type=blog

0. 前言

记录对unfold和fold的理解

1. 正文

1.1 unfold

def unfold(input, kernel_size, dilation=1, padding=0, stride=1):
    """
    input: tensor数据,四维, Batchsize, channel, height, width
    kernel_size: 核大小,决定输出tensor的数目。稍微详细讲
    dilation: 输出形式是否有间隔,稍后详细讲。
    padding:一般是没有用的必要
    stride: 核的滑动步长。稍后详细讲
"""

若kernel_size=2,stride=2,则如下图所示,
直观理解:就是从HW面挑选一个一个的“长条”,这个“长条”的长宽由kernel_size指定。
在这里插入图片描述
实际项目中的案例和维度变换

# (32,256,56,56) -> (32,1024,784)
x = F.unfold(x, kernel_size=2, dilation=1, stride=2)  

说明:

  1. 在实际维度变换中,是从上图的第一幅图像到最后图像,即:

(B, C, H, W) -> (B, C * ∏ \prod kernel_size, L),其中L由下图公式得到:

在这里插入图片描述
2. 更进一步,

  • 输入特征图为:(B, C, *)
  • 输出特征图为:(B, C, C * ∏ \prod kernel_size, L)

1.2 fold

fold即为上述的逆过程

参考

[1] https://pytorch.org/docs/stable/generated/torch.nn.Unfold.html#torch.nn.Unfold
[2] https://blog.csdn.net/qq_42518956/article/details/104669625

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

胡侃有料

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值