图像去雨：pytorch 输入和标签都是图片的数据集

最新推荐文章于 2023-11-02 20:24:16 发布

听风、

最新推荐文章于 2023-11-02 20:24:16 发布

阅读量3.1k

点赞数 20

分类专栏：笔记深度学习文章标签：深度学习人工智能神经网络机器学习

本文链接：https://blog.csdn.net/Wenyuanbo/article/details/116374897

版权

笔记同时被 2 个专栏收录

6 篇文章 11 订阅

订阅专栏

深度学习

3 篇文章 6 订阅

订阅专栏

引导

背景
简单步骤
代码实现
其他

背景

在研究使用深度学习的方法进诸如图像去噪、图像去雾、图像去马赛克等需求的时候，经常是受污染图片和干净图片互相对应，此时就需要制作这种成对应关系的数据集。本文使用的读取图片的方法是 PIL 库里的 Image.open()，初步学习，不对的地方还请指正。

简单步骤

获取两个文件夹下的所有图片(建议图片名称对应完全一样，且没有汉字)；
保持对应关系分别获取每个图片的具体路径；
读取图片数据；
进行必要的变换操作(根据读取图片的方法不同有异)；
返回受污染图片和相应的标签图片。
开始炼丹。

代码实现

以下代码在DataTrain.py里，功能是对图片数据进行读入和一定操作，方便后续使用torch.utils.data.DataLoader()方法获取数据集。

import torchvision
from torch.utils.data import  Dataset
import os
from PIL import Image
class MyDataset(Dataset): # 继承 Dataset 类
    def __init__(self, input_path, label_path):
        self.input_path = input_path # 受污染图片所在文件夹
        self.input_path_image = os.listdir(input_path) # 文件夹下的所有图片对象

        self.label_path = label_path # 干净图片所在文件夹
        self.label_path_image = os.listdir(label_path)
		
		# 定义要对图片进行的变换
        self.transforms = torchvision.transforms.Compose([
       		 # 中心裁剪64*64大小作为pacth
            torchvision.transforms.CenterCrop([64, 64]), 
            
            # 将读入的数据归一化[0, 1]之间并变为张量类型
            torchvision.transforms.ToTensor(), 
            ])

    def __len__(self):
        return len(self.input_path_image) # 返回长度
 
    def __getitem__(self, index):
    	# index 索引对应的受污染图片完整路径
        input_image_path = os.path.join(self.input_path, self.input_path_image[index])
        # 利用PIL.Image 读入图片数据并转换通道结构
        input_image = Image.open(input_image_path).convert('RGB')

        label_image_path = os.path.join(self.label_path, self.label_path_image[index])
        label_image = Image.open(label_image_path).convert('RGB')

		# 对读入的图片进行固定的变换
        input = self.transforms(input_image)
        label = self.transforms(label_image)

        return  (input, label) # 返回适合在网络中训练的图片数据

准备好图片数据之后就可以准备送入网络进行训练了，以下代码在 train.py 里用来获取数据集用作训练。

from DataTrain import MyDataset # 从前述 py 文件里导入 MyDataset 类
from torch.utils.data import DataLoader
from torch.autograd import Variable

BATCH_SIZE = 100 # 参与每次训练的数量，就是将数据集按照 BATCH_SIZE 大小进行拆分

dataset = MyDataset(input_path, label_path) # 实现前述定义的 MyDataset 类
data_train = DataLoader(dataset, batch_size=BATCH_SIZE,shuffle=True) # 获取训练数据集，拆分，打乱

# 这个循环一般在 epoch 循环下表示一次训练，x，y 对应前述返回的 input，label
for j, (x, y) in enumerate(data_train): 
	input = Variable(x).cuda() # 转换数据为 GPU 变量
	label = Variable(y).cuda()

# 接下来 input，label 就可以送入网络进行训练了