打乱划分自己的数据集，并加载到数据加载器中（2）

一只小小的土拨鼠

已于 2024-10-10 00:14:24 修改

点赞数

分类专栏：深度学习文章标签： pytorch 深度学习机器学习

于 2022-05-18 22:44:02 首次发布

本文链接：https://blog.csdn.net/qq_40379132/article/details/124846508

版权

深度学习专栏收录该内容

33 篇文章 1 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

在数据集的划分上:
既可以将训练用例和测试用例用四个不同的文件保存，分别是训练数据名和训练标签名，测试数据名和测试标签名，再根据文件中的名称，依次从全部数据中读取，完成划分。
也可以将全部数据的名称保存在两个文件中，分别是全部数据名和全部标签名，按照一定的比例划分，依次读取训练集和测试集。这种方法用到的相关代码如下：

import torch
import torchvision
import torchvision
import torchvision.transforms as transforms
import torch.utils.data as Data
import numpy as np
from torch.utils.data import Dataset
train_dataset = torchvision.datasets.MNIST(root='./data',  #文件存放路径
                            train=True,   #提取训练集
                            transform=transforms.ToTensor(),  #将图像转化为Tensor
                            download=True)
sample_size = len(train_dataset)#获取样本总数
indices = list

了解本专栏