【torch】torch.nn.functional 中的unfold和fold直观理解

胡侃有料

已于 2023-01-28 14:50:46 修改

阅读量1.6k

点赞数

分类专栏： # 深度学习基础知识文章标签： python 深度学习

于 2022-10-22 09:30:01 首次发布

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/weixin_39190382/article/details/127457275

版权

深度学习基础知识专栏收录该内容

51 篇文章 18 订阅

订阅专栏

every blog every motto: There’s only one corner of the universe you can be sure of improving, and that’s your own self.
https://blog.csdn.net/weixin_39190382?type=blog

0. 前言

记录对unfold和fold的理解

1. 正文

1.1 unfold

def unfold(input, kernel_size, dilation=1, padding=0, stride=1):
    """
    input: tensor数据，四维， Batchsize, channel, height, width
    kernel_size: 核大小，决定输出tensor的数目。稍微详细讲
    dilation: 输出形式是否有间隔，稍后详细讲。
    padding：一般是没有用的必要
    stride： 核的滑动步长。稍后详细讲
"""

若kernel_size=2,stride=2,则如下图所示，
直观理解：就是从HW面挑选一个一个的“长条”，这个“长条”的长宽由kernel_size指定。
在这里插入图片描述
实际项目中的案例和维度变换

# (32,256,56,56) -> (32,1024,784)
x = F.unfold(x, kernel_size=2, dilation=1, stride=2)

说明：

在实际维度变换中，是从上图的第一幅图像到最后图像，即：

（B, C, H, W） -> (B, C * $\prod$ kernel_size, L)，其中L由下图公式得到：

在这里插入图片描述
2. 更进一步，

输入特征图为：（B, C, *）
输出特征图为：（B, C, C * $\prod$ kernel_size, L）

1.2 fold

fold即为上述的逆过程

参考

[1] https://pytorch.org/docs/stable/generated/torch.nn.Unfold.html#torch.nn.Unfold
[2] https://blog.csdn.net/qq_42518956/article/details/104669625

胡侃有料

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
【torch】torch.nn.functional 中的unfold和fold直观理解

torch.nn.functional 中unfold和fold的直观理解
复制链接

扫一扫

专栏目录