作者:Naoki Shibuya
编译:ronghuaiyang
导读
如果你听说过转置卷积并对它的实际含义感到困惑,这篇文章就是为你写的。
上采样的需求
当我们使用神经网络来生成图像的时候,通常需要从低分辨率的图像上采样成高分辨率的图像。
有很多的方法来实现上采样的操作:
- 最近邻插值
- 双线性插值
- 双三次插值
这些方法都涉及插值,需要在确定网络结构时进行选择。它就像一个手工的特征工程,网络对此一无所知。
为什么用转置卷积?
如果我们想要我们的网络学习到如何最优化的进行上采样,我们可以使用转置卷积。它没有使用预先定义好的插值方法,具有可学习的参数。
理解转置卷积的概念非常有用,因为在一些重要的论文和工程都都会用到,比如:
- 在DCGAN中,生成器使用随机采样的值来生成全尺寸的图像。
- 在语义分割中,在编码阶段使用卷积层来抽取特征,然后在解码阶段,恢复原始的图像尺寸,对原始图像的每一个像素进行分类。
转置卷积也称为:
- 分