pytorch学习--制作数据集

最新推荐文章于 2024-09-05 11:42:07 发布

潘旭阳

最新推荐文章于 2024-09-05 11:42:07 发布

阅读量905

点赞数

分类专栏： pytorch 文章标签： pytorch

本文链接：https://blog.csdn.net/Joseph__Lagrange/article/details/109659326

版权

pytorch 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

pytorch制作数据集不像TensorFlow那么复杂，只需要交单的把数据集加载进来，继承Dataset类和dataloader类

继承Dataset类

在使用时只需要继承该类，并重写__len__()和__getitem()__函数，即可以方便地进行数据集的迭代。

from torch.utils.data import Dataset

class my_data(Dataset):
    def __init__(self, image_path, annotation_path, transform=None):
        """初始化，读取数据集"""
        pass

    def __len__(self):
        """获取数据集的总大小"""
        return

    def __getitem__(self, id):
        """对于指定的id，读取该数据并返回"""
        idx = id
        return

继承dataloader类

经过Dataset类封装，已经可以获取每一个样本，但是仍然无法进行批量处理、随机选取等操作，因此还需要torch.utils.data.Dataloader类进
一步进行封装

# 使用Dataloader进一步封装Dataset
dataset = my_data()
dataloader = Dataloader(dataset, batch_size=4,shuffle=True,num_workers=4)

潘旭阳

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录