pytorch官方教程---代码&中文注释&运行截图（3）

最新推荐文章于 2024-02-04 18:35:24 发布

lxbzty

最新推荐文章于 2024-02-04 18:35:24 发布

阅读量742

点赞数 1

分类专栏： pytorch 文章标签： pytorch python matplotlib pandas face

pytorch 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

第二节数据加载和处理教程

人脸识别

人脸识别

若干个face样本，每个样本有68个标记点，每个标记点对应一个x值和一个y值

导入包

import os
import torch
import pandas as pd
from skimage import io, transform
import matplotlib.pyplot as plt
from torch.utils.data import Dataset, DataLoader
from torchvision import transforms, utils
from FaceLandmarksDataset import FaceLandmarksDataset

显示图像

"""
快速读取CSV文件，并且以(N, 2)的数组形式获得标记点，其中N为标记点的个数，本例N=68。
"""
landmarks_frame = pd.read_csv('data/faces/face_landmarks.csv')      #读取csv文件
n = 65                                                              #选取第65个样本
img_name =  landmarks_frame.iloc[n, 0]                              #查看第65行第0列，即图片名
landmarks = landmarks_frame.iloc[n, 1:].as_matrix()                 #查看第65行第1列及之后所有列，即标记点，并转换成matrix
landmarks = landmarks.astype('float').reshape(-1, 2)                #转换成若干行2列，就本题而言转换成68行2列（1列x，一列y)
print('\nImage name: ', img_name)
print('\nLandmarks shape: ', landmarks.shape)
print('\nFirst 4 Landmarks: \n \tx\ty\n', landmarks[:4])            #输出所得矩阵的0,1,2,3,行数据


"""
显示图像和标记点，并用它来显示一个样本
"""
def show_landmarks(image, landmarks):                                       #image参数是图像名（路径），landmarks参数是标记点
    plt.imshow(image)                                                       #显示图像
    plt.scatter(landmarks[:, 0], landmarks[:, 1], s=10, marker='.', c='r')  #绘制散点图，0列即x 1列即y
    plt.pause(10)                                                           #使窗口停顿10秒


plt.figure()                                                                #创建一个用来显示图形输出的一个窗口对象
show_landmarks(io.imread(os.path.join('data/faces/', img_name)), landmarks) #读取文件夹，拼接字符串，调用自定义函数

运行结果：
在这里插入图片描述

创建数据集类

"""
torch.utils.data.Dataset是表示数据集的抽象类,自定义的数据集应该继承Dataset并重写以下方法：
#__len__ 使用len(dataset)将返回数据集的大小
#__getitem__ 支持索引，dataset[i]可以获取第i个样本
#在__init__中读取csv，而将在__getitem__存放读取图片的任务。因为所有的图像不是一次性存储在内存中，而是根据需要进行读取，这样可以高效的使用内存。
#我们的数据集是一个字典{'image': image, 'landmarks': landmarks}。数据集的类有一个可选的参数transform，这样就可以对数据做特定的预处理操作。
"""
class FaceLandmarksDataset(Dataset):
    def __init__(self, csv_file, root_dir, transform=None):          #csv_file是csv文件名（注意路径），root_dir是样本图像所在路径
        self.landmarks_frame = pd.read_csv(csv_file)                 #读取csv文件里样本数据
        self.root_dir = root_dir                                     #样本图像所在路径
        self.transform = transform
        

    def __len__(self):
        return len(self.landmarks_frame)                             #返回样本数据集的大小

    def __getitem__(self, idx):                                      #根据id编号读取样本图像
        img_name = os.path.join(self.root_dir,
                                self.landmarks_frame.iloc[idx, 0])   #获取当前样本图像名
        image = io.imread(img_name)                                  #获取图像
        landmarks = self.landmarks_frame.iloc[idx, 1:].as_matrix()   #获取当前图像的标记点
        landmarks = landmarks.astype('float').reshape(-1, 2)         #将标记点转换成x值一列，y值一列
        sample = {'image': image, 'landmarks': landmarks}            #样本的数据字典

        if self.transform:
            sample = self.transform(sample)

        return sample

实例化类并显示图像

face_dataset = FaceLandmarksDataset(csv_file='data/faces/face_landmarks.csv', root_dir='data/faces/')   #对上面定义的类的实例化

fig = plt.figure()                                                 #创建图像显示的窗口

for i in range(len(face_dataset)):                                 #遍历数据集
      sample = face_dataset[i]                                       #获取数据集中的第i个样本

      print(i, sample['image'].shape, sample['landmarks'].shape)     #输出图像id编号，图像的shape，标记点的shape

      ax = plt.subplot(1, 4, i + 1)                                  #图排成1行4列，图片放在id号+1的位置（从左至右从上往下，开始为1）
      plt.tight_layout()                                             #会自动调整子图参数，使之填充整个图像区域
      ax.set_title('Sample #{}'.format(i))                           #设置图像左上角的title
      ax.axis('off')
      #show_landmarks(**sample)                                       #法一：因为sample为字典，所以可以利用这种形式返回字典中所有键对应的值
      show_landmarks(sample['image'], sample['landmarks'])            #法二

       if i == 3:         #i=3就退出循环
          plt.show()
          break

运行结果：
在这里插入图片描述