上采样——转置卷积

最新推荐文章于 2024-05-17 19:23:21 发布

爱吃薯条的小夏

最新推荐文章于 2024-05-17 19:23:21 发布

阅读量663

点赞数 6

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45805398/article/details/135645106

版权

本文介绍了转置卷积，一种不同于传统上采样的深度学习技术，它利用可学习的参数进行上采样，而非固定插值。标准卷积不可逆，但转置卷积通过填充、翻转和卷积操作生成与输入特征图相同大小的矩阵。通过实例说明了转置卷积的运算步骤。

摘要由CSDN通过智能技术生成

上采样主要用于图像需要放大的情况。一些最流行的上采样方法是插值，包括最近邻插值、双线性插值和双三次插值。但是涉及到深度学习时，这些传统的上采样技术会过于死板，没有留下“学习”的空间。本文讲解了转置卷积。

转置卷积又称反卷积 (Deconvolution)。与传统的上采样方法相比，转置卷积的上采样方式并非预设的插值方法，而是同标准卷积一样，具有可学习的参数，可通过网络学习来获取最优的上采样方式。

卷积

标准卷积的运算操作是对卷积核中的元素与输入矩阵上对应位置的元素进行逐像素的乘积并求和。然后，卷积核在输入矩阵上以步长为单位进行滑动，直到遍历完输入矩阵的所有位置。

卷积原理：

将输入特征图进行展平，得到I，它是1行16列的矩阵
将构建的卷积核等效矩阵展平成列向量，构建出一个矩阵C，C是16行4列的矩阵
I和C相乘得到矩阵O，O就是输出特征图展平之后的结果

那么已知矩阵C和矩阵O，是否可以求出矩阵I呢？答案是不行，一个矩阵存在逆矩阵的条件是：它必须是一个方阵。而这里的矩阵C，并不是一个方阵，所以无法还原矩阵I。也就是说，一般情况下深度学习中的卷积是不可逆的。

但是如果不要求还原原始输入矩阵I，只想得到与输入矩阵相同大小的矩阵P是可以的。只需要在等号两边的右侧同时乘上矩阵C的转置就可以了。很明显，矩阵I和矩阵P是不相等的。

转置卷积原理：

接下来进行逆向操作：
首先将矩阵O还原为2×2的输入特征图，将矩阵C的转置矩阵C^T的每一列写成一个个2×2的等效矩阵（共16个），将还原的2×2的特征图与C转置的等效矩阵进行对应位置元素相乘累加求和，得到矩阵P每一个位置上的数值。

看右下角，对于输入特征图I先进行最外层的填充，拿绿色的矩阵与其进行元素相乘累加求和，二者的结果也为0

4.接下来再拿矩阵C的转置矩阵的第二个矩阵与输入特征图I进行对应位置元素相乘累加求和，结果为2，也就是伪逆卷积的结果P中的第二个值。

看右下角，对于输入特征图I先进行最外层的填充，拿绿色的矩阵与其进行元素相乘累加求和，二者的结果也为2

5.依次使用每一个等效矩阵与输入特征图I进行运算。

6.可以发现，通过绿色矩阵在填充过后的输入特征图I上进行卷积，也可以求出伪逆卷积的结果P中的每一个值。

7.绿色卷积核和最开始的卷积的参数是上下左右翻转之后的结果。

转置卷积计算

运算步骤：

1.在输入特征图元素间填充s-1行、列的0元素

2.在输入特征图四周填充k-p-1行、列的0元素

3.将卷积核参数上下、左右翻转

4.做正常卷积运算(步长为1，填充为0)——此时不需要再对特征图进行填充了——直接进行步长为1，填充为0的卷积运算

举例：s=1，p=0，k=3

1.在输入特征图元素间填充s-1=1-1=0行、列的0元素——不需要在特征图元素之间填充0元素

2.在输入特征图四周填充k-p-1=3-0-1=2行、列的0元素——在特征图四周填充2行2列的0元素

3.将卷积核参数上下、左右翻转

4.做正常卷积运算（步长为1，填充为0)

爱吃薯条的小夏

关注

6
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
上采样——转置卷积

上采样主要用于图像需要放大的情况。一些最流行的上采样方法是插值，包括最近邻插值、双线性插值和双三次插值。但是涉及到深度学习时，这些传统的上采样技术会过于死板，没有留下“学习”的空间。本文讲解了转置卷积。转置卷积又称反卷积 (Deconvolution)。与传统的上采样方法相比，转置卷积的上采样方式并非预设的插值方法，而是同标准卷积一样，具有可学习的参数，可通过网络学习来获取最优的上采样方式。标准卷积的运算操作是对卷积核中的元素与输入矩阵上对应位置的元素进行逐像素的乘积并求和。
复制链接

扫一扫

爱吃薯条的小夏 CSDN认证博客专家 CSDN认证企业博客

码龄5年

6: 原创

137万+: 周排名

13万+: 总排名

8322: 访问

: 等级

210: 积分

98: 粉丝

149: 获赞

3: 评论

165: 收藏

私信

关注

热门文章

最新评论

通俗易懂RNN和LSTM
CSDN-Ada助手: 恭喜您写了这么一篇通俗易懂的博客，对于理解RNN和LSTM帮助很大。希望您能继续保持创作的热情，不断分享更多深入浅出的文章。或许下一步可以尝试结合实际案例，让读者更直观地感受到RNN和LSTM的应用。期待您的下一篇作品！
PGGAN(ProGAN)解读与代码
CSDN-Ada助手: “恭喜你写了这篇关于PGGAN(ProGAN)的博客！很高兴看到你持续创作并分享你的知识。下一步，我希望你可以考虑深入研究PGGAN的应用领域，或者尝试将其与其他深度学习模型进行比较分析。期待你未来更多的精彩内容！” 如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
上采样——转置卷积
CSDN-Ada助手: 恭喜您写出了第三篇博客！标题中的“上采样——转置卷积”听起来很有深度，我很期待阅读您的文章。您对于深度学习领域的知识了解得如此深入，真是令人钦佩。希望您能继续保持创作的热情，因为我相信您的文章能够给读者带来新的启发和学习！对于下一步的创作建议，或许您可以考虑探讨一下转置卷积在图像生成或者语音处理中的应用，这将会是一个非常有趣的话题。期待您的新作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
SRGAN图片超分辨率代码逐行讲解（深度学习课设1）
CSDN-Ada助手: 恭喜你写了第一篇博客！对于SRGAN图片超分辨率代码的逐行讲解，真的很有深度学习的味道。不过，我觉得你可以在下一篇博客中加入一些实际案例或者应用场景，这样读者更容易理解和接受。希望你继续努力，期待你更多的精彩内容！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。