转置卷积/反卷积（Transpose Convolution/Deconvolution）详解

最新推荐文章于 2023-01-23 23:42:10 发布

酿久诗

最新推荐文章于 2023-01-23 23:42:10 发布

阅读量860

点赞数

分类专栏：分割与抠图文章标签：图像处理图像识别 numpy pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41731861/article/details/120223857

版权

分割与抠图专栏收录该内容

19 篇文章 5 订阅

订阅专栏

文章目录

1、提出背景及其应用
2、反卷积过程图解
3、反卷积数学推导
4、输出特征图尺寸
5、代码实现（Numpy/Pytorch）

1、提出背景及其应用

一般情况下，图像在经过多层的卷积运算后，其输出特征图的尺寸将会减小，图片分辨率降低。而在某些特定的任务中，我们需要将图像恢复或一定程度上增大，以便于后续的使用。这个恢复/增大图像尺寸，实现图像由小分辨率到大分辨率映射的操作，叫做上采样（Upsample）。转置卷积便是常见的上采样方法之一。与传统的上采样方法（最近邻插值、双线性插值等）相比，转置卷积不会使用预先设定的插值方法。它具有可学习的参数，通过让网络自行学习，来获取最优的上采样方式。转置卷积的本质是输入和输出关系被反向处理（标准卷积为多对一，转置卷积为一对多）。转置卷积在某些特定的领域应用广泛，如：

CNN 的可视化：通过转置卷积将 CNN 中得到的特征图还原到像素空间，以观察特定的特征图对哪些模式的图像敏感；
语义分割：使用卷积层在编码器中进行特征提取，然后在解码层中恢复原先的尺寸（使用转置卷积），最终对原来图像的每个像素都进行分类。经典方法如：FCN 和 UNet。

2、反卷积过程图解

图1. 反卷积图解

对图片进行转置卷积处理总体流程：对输入图像进行填充 $\rightarrow$ 正常卷积操作（卷积核旋转） $\rightarrow$ 按需要对输出特征图进行裁剪。

3、反卷积数学推导

在这里插入图片描述

反卷积操作只是恢复了矩阵 $X$ 的尺寸大小，并不能恢复 $X$ 的每个元素值

4、输出特征图尺寸

记input_size为 $\rm \hat{n}$ ，kernel_size 为k，padding为p，stride为s，则卷积输出尺寸 $\rm \bar{n}$ 为：

$\rm \bar{n}=\lfloor \frac{\hat{n}+2p-k}{s} \rfloor+1$

以 $\rm \bar{n}$ 为输入尺寸，则可推出转置卷积输出尺寸 $\rm \hat{n}$ 为：

$\rm\hat{n}=(\bar{n}-1)\cdot s -2p + k$

观察以上两式可得，总可以使用直接卷积来模拟转置卷积。

5、代码实现（Numpy/Pytorch）

【本文参考】

[1] 听六小桨讲AI | 第5期：卷积的变体之转置卷积;
[2] Tensorflow反卷积（DeConv）实现原理+手写python代码实现反卷积（DeConv）;
[3] 卷积与反卷积关系超详细说明及推导（反卷积又称转置卷积、分数步长卷积）;

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
转置卷积/反卷积（Transpose Convolution/Deconvolution）详解

转置卷积/反卷积（Transpose Convolution/Deconvolution）详解1、提出背景及其应用一般情况下，图像在经过多层的卷积运算后，其输出特征图的尺寸将会减小，图片分辨率降低。而在某些特定的任务中，我们需要将图像恢复或一定程度上增大，以便于后续的使用。这个恢复/增大图像尺寸，实现图像由小分辨率到大分辨率映射的操作，叫做上采样（Upsample）。转置卷积便是常见的上采样方法之一。与传统的上采样方法（最近邻插值、双线性插值等）相比，转置卷积不会使用预先设定的插值方法。它具有可学习
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。