反卷积，转置卷积理解

最新推荐文章于 2024-08-25 21:20:05 发布

just_sort

最新推荐文章于 2024-08-25 21:20:05 发布

阅读量1.2k

点赞数 1

分类专栏：深度学习论文阅读及算法详解

本文链接：https://blog.csdn.net/just_sort/article/details/79429217

版权

深度学习论文阅读及算法详解专栏收录该内容

102 篇文章 36 订阅

订阅专栏

$\quad$ 在学习对抗神经网络Gan的时候出现里这个概念，在网上找里一些博客，理解了一下这个概念。
$\quad$ 卷积：
$\quad$ 就是这个图啦，其中蓝色部分是输入的feature map，然后有3*3的卷积核在上面以步长为2的速度滑动，可以看到周围还加里一圈padding，用更标准化的参数方式来描述这个过程：
$\quad$ 二维的离散卷积(N=2)
$\quad$ 方形的特征输入( $i_1=i_2=i$ )
$\quad$ 方形的卷积核尺寸( $k_1=k_2=k$ )
$\quad$ 每个维度相同的步长( $s_1=s_2=s$ )
$\quad$ 每个维度相同的padding( $p_1=p_2=p$ )

$\quad$ $(i=5,k=3,s=2,p=1)$ ,输出特征尺寸 $o_1=o_2=o$
$\quad$ 其中，卷积层输入特征与输出特征尺寸和卷积核参数的关系为：
$o=(floor)[\frac{i+2p-k}{s}]+1$
$\quad$ 反卷积
这里写图片描述
$\quad$ 考虑一下这个图，其中的参数描述是:(i=4,k=3,s=1,p=0),输出o=2。
$\quad$ 对于这个运算,我们把3*3的卷积核展开成如下图所示的[4,16]的稀疏矩阵,其中非0元素 $w_{ij}$ 表示卷及核的第i行和第j列。

这里写图片描述
然后再把4*4的输入特征转换成[16,1]的矩阵X，那么Y=CX则是一个[4,1]的输出特征矩阵，把它重新排列2×2的输出特征就得到最终的结果，从上述分析可以看出卷积层的计算其实是可以转化成矩阵相乘的。通过上述的分析，我们已经知道卷积层的前向操作可以表示为和矩阵C相乘，那么我们很容易得到卷积层的反向传播就是和C的转置相乘。
反卷积的作用：噪声升维，上采样，从低维度进入高维度，比直接给定高维度随机形更强，这样就可以通过修改转置conv kernel去梯度下降出网络超参数