Pytorch——数据加载和处理

最新推荐文章于 2022-06-05 20:35:36 发布

左小田^O^

最新推荐文章于 2022-06-05 20:35:36 发布

阅读量159

点赞数

分类专栏： pytorch

本文链接：https://blog.csdn.net/qq_45802081/article/details/115459764

版权

pytorch 专栏收录该内容

26 篇文章 1 订阅

订阅专栏

Pytorch中进行数据处理的工具

scikit-image：用于图像的IO和变换
pandas：用于更容易地进行csv解析
从此处下载数据集。
数据存于“data / faces /”的目录中。这个数据集实际上是imagenet数据集标
注为face的图片当中在 dlib 面部检测 (dlib’s pose estimation) 表现良好的图片。我们要处理的是一个面部姿态的数据集。如下图
在这里插入图片描述
数据集类
torch.utils.data.Dataset 表示数据集的抽象类。
自定义数据集应继承Dataset并覆盖以下方法 * __len__ 实现 len(dataset) 返还数据集的尺寸。 * __getitem__ 用来获取一些索引数据，例如 dataset[i] 中的(i)。

建立数据集类
为面部数据集创建一个数据集类。我们将在 __init__ 中读取csv的文件内容，在 __getitem__ 中读取图片。
我们的数据样本将按这样一个字典 {‘image’: image, ‘landmarks’: landmarks} 组织。
我们的数据集类将添加一个可选参数 transform 以方便对样本进行预处理。 init 方法如下图所示：

class FaceLandmarksDataset(Dataset):
    """面部标记数据集."""
    
    def __init__(self, csv_file, root_dir, transform=None):
        """
        csv_file（string）：带注释的csv文件的路径。
           root_dir（string）：包含所有图像的目录。
            transform（callable， optional）：一个样本上的可用的可选变换
        """
        self.landmarks_frame = pd.read_csv(csv_file)
        self.root_dir = root_dir
        self.transform = transform
    
    def __len__(self):
        return len(self.landmarks_frame)

    def __getitem__(self, idx):
        img_name = os.path.join(self.root_dir,self.landmarks_frame.iloc[idx, 0])
        image = io.imread(img_name)
        landmarks = self.landmarks_frame.iloc[idx, 1:]
        landmarks = np.array([landmarks])
        landmarks = landmarks.astype('float').reshape(-1, 2)
        sample = {'image': image, 'landmarks': landmarks}
    
        if self.transform:
            sample = self.transform(sample)

        return sample

数据可视化

face_dataset = FaceLandmarksDataset(csv_file='data/faces/face_landmarks.csv',root_dir='data/faces/')

fig = plt.figure()

for i in range(len(face_dataset)):
    sample = face_dataset[i]
    
    print(i, sample['image'].shape, sample['landmarks'].shape)
    
    ax = plt.subplot(1, 4, i + 1)
    plt.tight_layout()
    ax.set_title('Sample #{}'.format(i))
    ax.axis('off')
    show_landmarks(**sample)
    
    if i == 3:
        plt.show()
        break

在这里插入图片描述

数据变换
通过上面的例子我们会发现图片并不是同样的尺寸。
绝大多数神经网络都假定图片的尺寸相同。
因此我们需要做一些预处理。让我们创建三个转换:
* Rescale ：缩放图片
* RandomCrop ：对图片进行随机裁剪。
* ToTensor ：这是一种数据增强操作，把numpy格式图片转为torch格式图片 (我们需要交换坐标轴).
我们会把它们写成可调用的类的形式而不是简单的函数，这样就不需要每次调用时传递一遍参数。我们只需要实现 call 方法，必要的时候实现 init 方法。我们可以这样调用这些转换: