【笔记】（getitem、init、DataLoader对象遍历时）数据集加载和训练过程中程序的执行流程

程序猿的探索之路

已于 2022-09-03 15:36:45 修改

阅读量1.1k

点赞数

分类专栏：小菜鸡加油文章标签： python

于 2021-07-01 17:07:36 首次发布

本文链接：https://blog.csdn.net/nyist_yangguang/article/details/118390973

版权

小菜鸡加油专栏收录该内容

399 篇文章 31 订阅

订阅专栏

Output：

/home/wangbin/anaconda3/envs/deep_learning/bin/python3.7 /media/wangbin/F/深度学习_程序/dog_cat/cat_dog.py
__init__ ./cat_dog/img
70周年
__len__ 12000
__len__ 12000
万岁

input() 键入

__len__ 12000
__getitem__ 0.348.jpeg
__getitem__ 0.5650.jpeg

...

无序的图片，共有12000张

...

__getitem__ 1.2151.jpeg
hello world

等待input()

import torch
import os
import numpy as np
from PIL import Image
from torch.utils.data import Dataset, DataLoader
import matplotlib.pyplot as plt


class MyDataSet(Dataset):
    def __init__(self, path):
        print("__init__",path)
        """根据路径获得数据集"""
        self.path = path

        """读取路径下的所有文件"""
        self.dataset = os.listdir(self.path)

        # 均值和方差的求解过程下面会交代
        self.mean = [0.4878, 0.4545, 0.4168]
        self.std = [0.2623, 0.2555, 0.2577]

    def __len__(self):
        print("__len__",len(self.dataset))
        """获取数据集的长度"""
        return len(self.dataset)

    def __getitem__(self, index):
        """根据索引获得数据集"""
        print("__getitem__",self.dataset[index])
        # 获得数据的标签
        name = self.dataset[index]
        # 数据集的文件名为i.j.jpeg, 这个标签的第i个位置如果是0表示猫，1则表示狗，第j个位置是图片的个数
        name_list = name.split(".")
        target = int(name_list[0])

        # 这里需要注意，tensor(target) 和Tensor([target])的区别，否则在one-hot解码的时候会出现错误
        target = torch.tensor(target)

        """数据预处理"""
        # 打开图片
        img = Image.open(os.path.join(self.path, name))

        # 设置图片大小
        # img = np.resize(img, (3, 10, 10))

        # 归一化，先将图片转化为一个矩阵，然后除以255
        img = np.array(img) / 255

        # # 去均值
        # img = (img - self.mean) / self.std

        # 换轴 H W C 转换为 C H W ，这里需要注意下，其实我们可以不这么处理，在前面设置图片大小的时候设置为3 * 100 * 100 的就可以。
        train_data = torch.tensor(img, dtype=torch.float32).permute(2, 0, 1)
        return train_data, target


if __name__ == '__main__':
    """注意：求均值和标准差时，首先把上面去均值的那一行代码注释了"""
    dataset = MyDataSet(r'./cat_dog/img')
    print("70周年")
    # 求均值，将DataLoader进行打包，这里batch_size的数量应该是训练图片的总数
    data_loader = DataLoader(dataset=dataset, batch_size=12000, shuffle=True)
    print("万岁")
    input()

    # 将data_loader作为一个迭代器进行运算，这里面包含了输入数据和标签，所以后面取第0个位置的数，也就是取输入数据
    for x,y in data_loader:
        print("hello world")
        input()
        print(x.size(),y.size(),x[0][0])
        plt.imshow(x[0][0])
        plt.show()
        print(x,y)
        input()
    data = next(iter(data_loader))[0]
    # print(data,data.size())

    # 这里图片N(每批的数量) C（通道数） H（高）  W（宽） 几个维度，求的.0是通道层面的均值，所以dim=(0, 2, 3)
    mean = torch.mean(data, dim=(0, 2, 3))
    std = torch.std(data, dim=(0, 2, 3))

    print(mean)
    print(std)

/home/wangbin/anaconda3/envs/deep_learning/bin/python3.7 /media/wangbin/F/深度学习_程序/dog_cat/cat_dog.py
__init__ ./cat_dog/img
70周年
__len__ 12000
__len__ 12000
万岁

__len__ 12000
__getitem__ 0.348.jpeg
__getitem__ 0.5650.jpeg

...

无序的图片，共有12000张

...

__getitem__ 1.2151.jpeg
hello world

附：