卷积（Convolution）与转置卷积(Convolution Transposed)

最新推荐文章于 2024-05-12 07:17:59 发布

geter_CS

最新推荐文章于 2024-05-12 07:17:59 发布

阅读量771

点赞数 1

分类专栏： pytorch 深度学习机器学习文章标签：卷积转置卷积 ConvTranspose

本文链接：https://blog.csdn.net/geter_CS/article/details/84667969

版权

深度学习同时被 3 个专栏收录

23 篇文章 4 订阅

订阅专栏

机器学习

21 篇文章 3 订阅

订阅专栏

pytorch

14 篇文章 7 订阅

订阅专栏

要注意转置卷积有点类似卷积的反向传播，并不是等价于反向传播。因为转置卷积只是恢复了原图的size而没有恢复其值。

卷积

在这里插入图片描述

如下上图所示输入是 $5 * 5$ 的，卷积核是 $3 * 3$ ，然后pading是0，stride是1。卷积过程如第二幅图所示。根据计算公式 $(W - F + 2 P) / S + 1$ ，有 $(5 - 3 + 2 * 0) / 1 + 1$ 可以看到卷积之后结果是 $3 * 3$ 的feature map。

下面我们使用矩阵来表示这个过程，我们首先将image矩阵和feature map矩阵写成列向量形式：

$\begin{bmatrix} 1 , 1, 1, 0,0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0 ,1 ,1, 0, 0 ,1 \end{bmatrix}^T$

输入的size是（26,1）表示为X，多出来的1是用于bias计算用的。

$\begin{bmatrix} 4, 3,4, 2, 4, 3, 2, 3, 4 \end{bmatrix}^T$

feature map的size是（9,1）表示为Y

由于我们通过公式 $(W - F + 2 P) / S + 1$ ，已经知道输出Feature map的size为（9,1），所以我们将卷积核展开成size为（9,26）的稀疏矩阵：

$\begin{bmatrix} 1 &0 &1 & 0 & 0 &0 &1 & 0 &0 &0 &1 &0 &1 & 0 & 0 &0 & 0& 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 &0 \\ 0& 1 &0 &1 & 0 & 0 &0 &1 & 0 &0 &0 &1 &0 &1 & 0 & 0 &0 & 0& 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0&0& 1 &0 &1 & 0 & 0 &0 &1 & 0 &0 &0 &1 &0 &1 & 0 & 0 &0 & 0& 0 & 0 & 0 & 0 & 0 & 0 &0 \\ 0&0&0&0&0&1 &0 &1 & 0 & 0 &0 &1 & 0 &0 &0 &1 &0 &1 & 0 & 0 &0 & 0& 0 & 0 & 0 & 0 \\ 0&0&0&0&0&0&1 &0 &1 & 0 & 0 &0 &1 & 0 &0 &0 &1 &0 &1 & 0 & 0 &0 & 0& 0 & 0 & 0 \\ 0&0&0&0&0&0&0&1 &0 &1 & 0 & 0 &0 &1 & 0 &0 &0 &1 &0 &1 & 0 & 0 &0 & 0& 0 & 0\\ 0&0&0&0&0&0&0&0&0&0&1 &0 &1 & 0 & 0 &0 &1 & 0 &0 &0 &1 &0 &1 & 0 & 0 &0 \\ 0&0&0&0&0&0&0&0&0&0&0&1 &0 &1 & 0 & 0 &0 &1 & 0 &0 &0 &1 &0 &1 & 0 & 0 \\ 0&0&0&0&0&0&0&0&0&0&0&0&1 &0 &1 & 0 & 0 &0 &1 & 0 &0 &0 &1 &0 &1 & 0 \end{bmatrix}$

可以看见卷积核展成稀疏矩阵是有明显规律的。这个稀疏矩阵称为C。因此卷积的过程就可以表示为：

$C X = Y$

可以知道维度（9,26）的矩阵与维度为（26,1）的矩阵点乘得到维度为（9,1）的feature map。那么对于转置卷积来说，其操作目的就是要使feature map还原到其原来的图像的size。所以用Y点乘C的转置刚好就回到图像的size:

$C^TY=X$

也就是维度（26,9）与维度(9,1)点乘结果刚好为（26,1），再去掉偏置项，就回到原图size。转置卷积的过程就是这样，只不过，只是还原其size，没有还原其值。这个在Gan中常用到,这是因为Gan需要把图还原到真实的size。

为甚说有点类似卷积的反向传播，这是因为卷积网络反向传播时，梯度会从feature map这边映射会原图，所以有点类似于反向传播，但是不等同。

这里我们使用Pytorch来举个栗子：

我们有一张图片是size为（280,280）的png，灰度图像，通道数为1，转为矩阵后size为（1,280,280）。我们先对其进行卷积，然后在进行转置卷积，看看效果：

import torch
from PIL import Image
import torch.nn as nn
import numpy as np

pic=Image.open('test1.png')
pic_array=np.asarray(pic)
print('pic_array.shape:',pic_array.shape)
pic_array_re=pic_array.reshape(1,1,280,280)
print('pic_array.shape_re:',pic_array_re.shape)
pic_tensor=torch.Tensor(pic_array_re)
print('pic_tensor.shape:',pic_tensor.shape)
Cov=nn.Conv2d(1,1,4,1,0) #(inchannels,out_channels,kernel_size,stride,padding)
pic_cov=Cov(pic_tensor)
print('pic_cov.shape:',pic_cov.shape)


Cov_tran=nn.ConvTranspose2d(1,1,4,1,0)
pic_cov_tran=Cov_tran(pic_cov)
print('pic_cov_tran.shape:',pic_cov_tran.shape)

输出结果为：
pic_array.shape: (280, 280)
pic_array.shape_re: (1, 1, 280, 280)
pic_tensor.shape: torch.Size([1, 1, 280, 280])
pic_cov.shape: torch.Size([1, 1, 277, 277])
pic_cov_tran.shape: torch.Size([1, 1, 280, 280])

可以看见转置卷积就是一个图像size还原的过程，你就把它当成一个图像放大的卷积过程就行了，但是要注意转置卷积要想恢复原来的size，其参数设置要与卷积过程对应。那么怎么确定转置卷积后的结果的size呢？

我们可以知道在 nn.ConvTranspose2d(1,1,4,1,0)中，第一个参数表示输入的通道数，第二个参数是输出的通道数，第三个参数是与此转置卷积对应的卷积操作中使用的卷积核size，第四个参数是与此转置卷积对应的卷积操作中使用的stride，第四个参数是与此转置卷积对应的卷积操作中使用的padding，设此转置卷积对应的卷积操作得到的feature map的size是 $M * M$ ，也就是此转置卷积的输入的size为 $M * M$ ，根据公式 $(W - F + 2 P) / S + 1 = M$ ，我们有 $W = S (M - 1) + F - 2 P$ 这样我们就得到了转置卷积后图像的size，也就是原始图像的size。比如在上例中， $W = 1 * (277 - 1) + 4 - 2 * 0 = 280$ 。

geter_CS

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
卷积（Convolution）与转置卷积(Convolution Transposed)

要注意转置卷积有点类似卷积的反向传播，并不是等价于反向传播。因为转置卷积只是恢复了原图的size而没有恢复其值。卷积如下上图所示输入是5∗55*55∗5的，卷积核是3∗33*33∗3，然后pading是0，stride是1。卷积过程如第二幅图所示。根据计算公式(W−F+2P)/S+1(W-F+2P)/S+1(W−F+2P)/S+1，有(5−3+2∗0)/1+1(5-3+2*0)/1+1(5−...
复制链接

扫一扫