【keras/Tensorflow/pytorch】Conv2D和Conv2DTranspose详解

最新推荐文章于 2025-03-13 15:46:10 发布

胡侃有料

最新推荐文章于 2025-03-13 15:46:10 发布

阅读量3.3k

点赞数 5

分类专栏： # 深度学习基础知识

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/weixin_39190382/article/details/115710706

版权

深度学习基础知识专栏收录该内容

51 篇文章

订阅专栏

本文详细介绍了卷积操作Conv2D和反卷积操作Conv2DTranspose的原理，包括输出特征图的计算方法。重点讨论了步幅、填充和输入输出尺寸的关系，并通过案例分析加深理解。强调了在逆卷积中步幅参数的特殊含义。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

every blog every motto: We would rather reuse an active dwarf than a sleeping giant.

0. 前言

一直划水。。。

1. 正文

1.1 Conv2D

说明： 关于这部分之前有写过，所以就不详细展开了，具体可以参考参考文章1 参考文章2
在这里插入图片描述

在这里插入图片描述
输出特征图计算：

1.2 Conv2DTranspose

Conv2DTranspose一般称为反卷积、逆卷积等，对图片进行一个上采样过程，即放大图片。
主要通过三步进行：

对输入特征图m进行变换，生成新的输入特征图m’
对卷积核k进行变换，生成新的卷积核k’
用上面产生的新的输入特征图和新的卷积核进行1.1中的常规卷积操作

变量说明：
输入特征图：(H,W)
卷积核：（K,K），步幅：S，填充padding

在这里插入图片描述

1.2.1 分步骤讲解

第一步：对输入特征图进行变换

对输入特征图进行插值，输入特征图值之间插0，如下图
在这里插入图片描述
当然，具体来说：
两个相邻位置中间的插0个数： S-1
对应输入的高为H，中间有(H-1)个空隙，则
高度方向上总插0个数： （H-1）*(S-1)

新的输入特征图的大小，以高度为例：
H’ = H + (H-1)*(S-1)

第二步：对卷积核进行变换

说明： 准确说是填充变换。

卷积核大小不变：（K,K）
步幅，S’=1 ，这里不好理解，后面解释
填充：padding’ = K-padding-1

第三步：普通卷积操作

由1.1知，普通卷积的特征图变换为

$\frac{ (Hin+2p-k)}{S}+1$
将第一、二步中变换的结果代入上式，的

$\frac{H+HS-H-S+1+2K-2padding-2-k}{S'}+1$
化简，得：
$\frac{(H-1）S+K-2padding-1}{S'}+1$
上式中分母步幅为1，则
最终结果为：
$H o u t = (H - 1 ） S + K - 2 p a d d i n g$

至此， Conv2D和Conv2DTranspose 在输入和输出形状方面互为倒数。

关于步幅：
说明： 仅做一般性说明，非严格计算，此部分不理解可以跳过，回头再看。

正常卷积（大图变小图）情况下：
输入（5,5），步幅（2,2），输出（3,3）
逆卷积操作中，
小图变大图，输入（3,3）输出（5,5）

在这里插入图片描述
强调：
逆卷积Conv2DTranspose中有步幅这一个参数，具体来说应该是卷积（大图变小图）的步幅，即有（5,5）到（3,3）的步幅，逆卷积操作的步幅永远为1。
逆卷积Conv2DTranspose中有步幅这一个参数，具体来说应该是卷积（大图变小图）的步幅，即有（5,5）到（3,3）的步幅，逆卷积操作的步幅永远为1。
逆卷积Conv2DTranspose中有步幅这一个参数，具体来说应该是卷积（大图变小图）的步幅，即有（5,5）到（3,3）的步幅，逆卷积操作的步幅永远为1。