pytorch实战5——DataLoader数据集制作

Evan_qin_yi_quan

已于 2023-03-07 15:25:43 修改

阅读量4.5k

点赞数 8

分类专栏： Pytorch 文章标签： pytorch 深度学习人工智能

于 2023-02-25 11:06:17 首次发布

本文链接：https://blog.csdn.net/evan_qin_yi_quan/article/details/129212918

版权

Pytorch 专栏收录该内容

9 篇文章 7 订阅

订阅专栏

本文详细介绍了如何在PyTorch中自定义数据集，包括读取txt文件中的图像路径和标签，构建数据列表，整合到`FlowerDataset`类中，定义数据预处理变换，实例化dataloader，并进行数据验证。接着，文章提到了构建损失函数和优化器以及训练模型的函数，展示了一个完整的训练过程。

摘要由CSDN通过智能技术生成

1.如何自定义数据集：

咱们以花朵数据集为例：

任务1：读取txt文件中的路径和标签

任务2：通过上面字典返回数据，分别把数据和标签都存在list里

任务3：图像数据路径得完整

任务4：把上面那几个事得写在一起,整合到一个类。

任务5：数据预处理(transform)¶

任务6：根据写好的class FlowerDataset(Dataset):来实例化咱们的dataloader

任务7：用之前先试试，整个数据和标签对应下，看看对不对

任务8：把做到的数据往模型里传

2.构建损失函数和优化器

训练函数

1.如何自定义数据集：

1.数据和标签的目录结构先搞定(得知道到哪读数据)
2.写好读取数据路径和标签路径的函数(根据自己数据集情况来写)
3.完成单个数据与标签读取函数(给dataloader举一个例子)

咱们以花朵数据集为例：

原来数据集都是以文件夹为类别ID，现在咱们换一个套路，用txt文件指定数据路径与标签(实际情况基本都这样)
这回咱们的任务就是在txt文件中获取图像路径与标签，然后把他们交给dataloader
核心代码非常简单，按照对应格式传递需要的数据和标签就可以啦
需要到的flower数据集链接：https://pan.baidu.com/s/1RVAlr-uTczP2ZEHgFfdmVw
提取码：micx

train.txt: 指定图片名字和分类标签

image_06734.jpg 0
image_06735.jpg 0
image_06736.jpg 0
image_06737.jpg 0
image_06738.jpg 0
image_06740.jpg 0
image_06741.jpg 0

import os
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
import torch
from torch import nn
import torch.optim as optim
import torchvision
#pip install torchvision
from torchvision import transforms, models, datasets
#https://pytorch.org/docs/stable/torchvision/index.html
import imageio
import time
import warnings
import random
import sys
import copy
import json
from PIL import Image

任务1：读取txt文件中的路径和标签

第一个小任务，从标注文件中读取数据和标签
至于你准备存成什么格式，都可以的，一会能取出来东西就行

def load_annotations(ann_file):
    data_infos = {}
    with open(ann_file) as f:  #打开文件
        samples = [x.strip().split(' ') for x in f.readlines()] #一行行去读，以空格作为切分，[ [xxx.jpg,'1' ],[xxx,jpg,'2' ]  ]
        for filename, gt_label in samples:  # filename为xxx.jpg，gt_label为分类值
            data_infos[filename] = np.array(gt_label, dtype=np.int64)#构建字典，图片名为key，分类值为value，组合
    return data_infos #返回字典

返回的字典内容

关于strip()和split()函数用方法，参考博客Python中的strip().split(‘\t‘)的用法和解释_AI学习的我的博客-CSDN博客