【pytorch】【Dataset/DataLoader】制作数据集(一)

导入自定义数据

来源官方教程
数据下载链接:https://download.pytorch.org/tutorial/faces.zip

1、导入库
import matplotlib.pyplot as plt
import os
import numpy as np
import pandas as pd
import warnings
import torchsnooper
from torch.utils.data import Dataset, DataLoader
import pandas as pd
import torch
from skimage import io, transform
from torchvision import transforms, utils

warnings.filterwarnings("ignore")
2、查看单个样本
landmark_frame = pd.read_csv("faces\\face_landmarks.csv")
n = 64
image_name = landmark_frame.iloc[n, 0]
landmark = landmark_frame.iloc[n, 1:]
landmark = np.asarray(landmark)
landmark = landmark.astype(float).reshape(-1, 2)

def show_image(image_file, landmarks):
    image = io.imread(image_file)
    plt.imshow(image)
    plt.scatter(landmark[:, 0], landmark[:, 1], s=10, c='r', marker='.')
    plt.pause(0.001)

plt.ion()
image_file = os.path.join('faces', image_name)
image = io.imread(image_file)
plt.figure()
show_image(image_file, landmark)
plt.show()

知识点:

pandas:
DataFrame.iloc[]#像数组一样访问元素
3、制作数据集

总结:
继承类:torch.utils.data.Dataset 初始化:init() 实现接口:len(self)、getitem(self, idx)

返回: 返回的类型类似于字典列表,可以通过方括号[]进行索引获得每条数据。 类似于data = [dict1,dict2,dict3],data[0]

此处是继承一个类,并且要实现其接口,接口必须要实现,通过接口使得这个类更加具有灵活 性,想返回什么样类型的,只要将其包装成字典就可以。

class FaceLandMarksDataset(Dataset):
    def __init__(self, csv_file, root_dir, transform=None):
        super(FaceLandMarksDataset, self).__init__()
        self.img_file 
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值