内涵：pyTorch学习之加载自己的数据集

学弟

已于 2024-03-31 20:55:01 修改

阅读量1.2w

点赞数

分类专栏： # 内涵文章标签： PyTorch 自己的数据集 Dataset 训练模型

于 2018-03-25 13:47:00 首次发布

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/u011345885/article/details/79685956

版权

内涵专栏收录该内容

43 篇文章 1 订阅

订阅专栏

pyTorch根据filelist加载自己的数据集合,无论图片是否在一个文件夹还是一个类的图片在一个文件夹。

第一步：继承实现Dataset类别

def default_loader(path):
    return Image.open(path).convert('RGB')
class MyDataset(Dataset):
    def __init__(self, txt, transform=None, target_transform=None, loader=default_loader):
        fh = open(txt, 'r')
        imgs = []
        for line in fh:
            line = line.strip('\n')
            line = line.rstrip()
            words = line.split()
            imgs.append((words[0],int(words[1])))
        self.imgs = imgs
        self.transform = transform
        self.target_transform = target_transform
        self.loader = loader
    def __getitem__(self, index):
        fn, label = self.imgs[index]
        img = self.loader(fn)

        if self.transform is not None:
            img = self.transform(img)
        else:
            img = Tensor.from_numpy(img)
        return img,label

def __len__(self): return len(self.imgs)

第二步骤：就直接可以用自己定义的这个类，来构建自己的dataset了

transform = transforms.Compose([transforms.Scale((227,227)),transforms.RandomHorizontalFlip(),transforms.ToTensor(),transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])])
train_data = MyDataset(txt='train_filelist.txt',transform=transform)

其中比较有用的一个点是

transforms.Scale((227,227))

用来将不同大小的图片resize到统一尺寸。

还有一个点就是，彩色图片都要做的归一化

transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])

学弟

关注

0
点赞
踩
27

收藏

觉得还不错? 一键收藏
打赏
4
评论
内涵：pyTorch学习之加载自己的数据集

pyTorch根据filelist加载自己的数据集合,无论图片是否在一个文件夹还是一个类的图片在一个文件夹。第一步：继承实现Dataset类别def default_loader(path): return Image.open(path).convert('RGB')class MyDataset(Dataset): def __init__(self, txt...
复制链接

扫一扫