转置卷积详解

最新推荐文章于 2024-07-26 20:14:05 发布

August-us

最新推荐文章于 2024-07-26 20:14:05 发布

阅读量2.5w

点赞数 1

分类专栏：深度学习文章标签：神经网络深度学习卷积反卷积转置卷积

本文链接：https://blog.csdn.net/m0_38065572/article/details/104846290

版权

本文详细介绍了转置卷积（又称反卷积）的概念，起源于图像分割任务，用于解决卷积神经网络中尺寸缩小的问题。转置卷积通过上采样恢复特征图尺寸，其运算可通过卷积核转置实现。在Tensorflow和Pytorch中，转置卷积通过填充和膨胀操作来调整尺寸。文中还探讨了转置卷积的输出尺寸计算公式，并通过实例和图表帮助理解这一过程。

摘要由CSDN通过智能技术生成

转置卷积详解

前面文章对卷积做了讲解，感觉既然重新整理，就将系列概念整体做个梳理，也算是将自己知道的所有东西拿来献丑把。
转置卷积(Transposed Convolution)是后来的叫法，一开始大家都是称逆卷积/反卷积(Deconvolution)，这个概念是在图像分割任务中被提出来的，图像分割需要逐像素的操作，对每一个像素做一个分割，将其归类到不同的物体当中。
这个任务大家很自然的想要使用卷积神经网络来完成，那就得先使用卷积神经网络提取特征，但是卷积神经网络中的两大主要构件，卷积层和下采样层会使得图像的尺寸不断缩小。这个就与逐像素的分类不符，因为逐像素分割的话是需要输出和输入大小是一致的。
针对这个问题，有人提出了先使用卷积核下采样层逐层的提取特征，然后通过上采样再将特征图逐渐的恢复到原图的尺寸。而这个上采样一开始就是通过反卷积来实现的。如果说卷积核下采样的过程特征图是变小的，那么上采样之后特征图应该变大。
我们应该熟悉卷积的输出尺寸公式 $o u t = (F - K + 2 P) / s + 1$ ，其中F表示输入特征图的尺寸，K表示卷积核的尺寸，P表示padding，S表示卷积的步长。我们都通过这个公式来计算卷积的输出特征图尺寸。举例来说明，一个4×4的输入特征图，卷积核为3×3，如果不使用paddng，步长为1，则带入计算 $o u t = (4 - 3) / 1 + 1$ 为2。
我们已经在im2col算法的介绍中讲解了卷积的实现，实际上这个步骤是通过两个矩阵的乘法来完成的，我们不妨记为 $y = C x$ ，如果要上采样，我们希望给输出特征图乘一个参数矩阵，然后把尺寸还原回去，根据数学知识，我们给特征图矩阵 $y$ 左乘一个{C^T}，就能得到 $C^Ty=C^TCx$ ，