Pytorch快速入门系列---（十四）搭建卷积自编码对图像去噪

城南皮卡丘

已于 2023-08-13 11:15:46 修改

阅读量1.6k

点赞数

分类专栏： # Pytorch深度学习理论与实战文章标签： pytorch 深度学习计算机视觉

于 2023-04-01 11:51:23 首次发布

本文链接：https://blog.csdn.net/qq_42681787/article/details/129875226

版权

Pytorch深度学习理论与实战专栏收录该内容

33 篇文章 48 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本篇文章介绍基于卷积层的自编码去噪网络。利用卷积层进行图像的编码和解码,是因为卷积操作在提取图像的信息上有较好的效果，而且可以对图像中隐藏的空间信息等内容进行较好的提取。该网络可用于图像去噪、分割等。

在基于卷积的自编码图像去噪网络中，其作用过程如下图所示。在网络中输入图像带有噪声，而输出图像则为去噪的原始图像,在编码器阶段，会经过多个卷积、池化、激活层和BatchNorm层等操作，逐渐降低每个特征映射的尺寸,如将每个特征映射编码的尺寸降低到24×24，即图像的大小缩为原来的1/16;而特征映射编码的解码阶段，则可以通过多个转置卷积、激活层和BatchNorm层等操作，逐渐将其解码为原始图像的大小并且包含3个通道的图像,即96×96的RGB图像。

1.去噪自编码网络数据准备

先简单介绍一下训练网络使用到的图像数据集——STL10，该数据集可以通过torchvision.datasets模块中的STL10()函数进行下载，该数据集共包含三种类型数据,分别是带有标签的训练集和验证集，分别包含5000张和8000张图像，共有10类数据，还有一个类型包含10万张的无标签图像，均是96×96的RGB图像，可用于无监督学习。虽然使用STL10()函数可直接下载该数据集，但数据大小仅约2.5GB，且下载的数据是二进制数据，故建议直接到数据网址下载,并保存到指定的文件夹。
为了节省时间和增加模型的训练速度，在搭建的卷积自编码网络中只使用包含5000张图像

了解本专栏

超级会员免费看

城南皮卡丘

关注

0
点赞
踩
15

收藏

觉得还不错? 一键收藏
打赏
1
评论
Pytorch快速入门系列---（十四）搭建卷积自编码对图像去噪

本篇文章介绍基于卷积层的自编码去噪网络。利用卷积层进行图像的编码和解码,是因为卷积操作在提取图像的信息上有较好的效果，而且可以对图像中隐藏的空间信息等内容进行较好的提取。该网络可用于图像去噪、分割等。
复制链接

扫一扫