Pytorch中torch.nn.ConvTranspose2d函数详解

最新推荐文章于 2024-08-12 04:15:00 发布

rotk2015

最新推荐文章于 2024-08-12 04:15:00 发布

阅读量9.9k

点赞数 12

分类专栏： Pytorch 文章标签：反卷积卷积神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rotk2015/article/details/102500371

版权

Pytorch 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

原理

ConvTranspose，即反卷积，通过卷积的形式，利用图像特征“恢复”到原图像。

当然，此处卷积核的权重参数与前面下采样卷积核的参数互相独立，且可更新。

也就是说“反”卷积不是之前的逆过程，无法保证完全恢复。

事实上，反卷积仅仅保留了特征与前级特征，点之间的对应关系。

代码详解

简明起见，引入“正卷积”概念，意指从低级特征到高级特征的过程。

ConvTranspose2d 与 Conv2d 的参数形式、含义基本一致。需要注意的仅两点：

out_padding 这个也是补零，但是对反卷积后的特征图补零。
- 设置该参数是由于不同尺寸的特征经卷积（下采样）后可以产生相同尺寸的特征，那么在反卷积对应回去的时候，通过out_padding解决多尺寸的问题。说白了，根本原因在于之前的卷积（下采样）有时会无法利用所有原始信息，有边角料未利用，如：input=5x5，padding=0，kernel_size=2x2，stride=2这种情况。
stride & padding 卷积步长和补零。
- 反直觉的是：padding为之前“正卷积”补零个数。
  - padding=0，“正卷积”为valid模式，那么要恢复原尺寸，反卷积就应为full模式，即为该特征两侧各补kernel_size-1个0；
  - padding=kernel_size-1，那么“正卷积”为full模式，则反卷积不用再补零。
  - padding=p，where 0<p<kernel_size-1，反卷积每侧补零数为kernel_size-1-p，即所谓p'=kernel_size-1-p。
- stride 不再控制上采样的步长，而是控制输入特征图中，像素点间的间隙。原来的步长概念此时恒为1。stride默认为1，即无间隙。若stride=m，则输入特征图的像素点增添间隙，散开来，尺寸变为（input-1）x stride+1。
  - 事实上，这里的增大间隙正是下采样增大步长的对应过程。原来增大步长后，所卷积得到的特征图的相邻点，映射到原特征的区域之间的间距会变大。那么再通过卷积反求原来的低级特征时，就要将这个间距实实在在体现到对高级特征的处理上，即所谓增大间隙。（反卷积又称分数步长卷积，此即分数步长之体现、由来）

综上，给出ConvTranspose2d输入、输出特征大小计算式：

令输入特征大小为 i，输出为 o，反卷积核为 k x k，则有

$o=\frac{\left \{ \left [\left ( i-1 \right )\times stride +1 \right ] +\left [ \left ( k-1-padding \right ) \times 2\right ]-k\right \}}{default\equiv 1}+1+outpadding$

$o=\left ( i-1 \right )\times stride+k-2padding+outpadding$

可参考如下链接：Transposed convolution arithmetic

关注

12
点赞
踩
39

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

rotk2015 CSDN认证博客专家 CSDN认证企业博客

码龄7年

37: 原创

11万+: 周排名

198万+: 总排名

5万+: 访问

: 等级

659: 积分

9: 粉丝

56: 获赞

10: 评论

150: 收藏

私信

关注

分类专栏

ubuntu 1篇
FPGA 2篇
JAVA 20篇
C语言 1篇
数据结构与算法 15篇
离散数学 1篇
C++ 1篇
ST3 1篇
Pytorch 3篇
Python 1篇
BUG 3篇
Numpy 1篇

最新评论

C语言参数传递——地址传递与值传递
shmily_ke: 例三交换函数中形参值的交换不影响实参的值，所以是值传递，函数结束后，外面俩值不变，运行一遍就知道了
C语言参数传递——地址传递与值传递
Fernweh879: 例三为什么是值传递
C语言参数传递——地址传递与值传递
m0_67316481: 为啥例三是值传递不是用了指针了吗
Pytorch中torch.nn.Conv3D、torch.nn.Conv2D函数详解
jlong_cs: 你好，我请问一下这个时间尺度是可以不等的吗？
算法心得-未完待续
阿J~: 好，先收藏，欢迎回关，欢迎订阅我，阿J~

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。