使用PyTorch中Dataset和Dataloader遇到的问题

最新推荐文章于 2024-02-28 23:45:00 发布

xgbm_k

最新推荐文章于 2024-02-28 23:45:00 发布

阅读量6.6k

点赞数 2

分类专栏：深度学习

本文链接：https://blog.csdn.net/xgbm_k/article/details/84067245

版权

深度学习专栏收录该内容

7 篇文章 1 订阅

订阅专栏

今天在使用PyTorch中Dataset遇到了一个问题。先看代码

class psDataset(Dataset):
    def __init__(self, x, y, transforms = None):
        super(Dataset, self).__init__()
        self.x = x
        self.y = y
        if transforms == None:
            self.transforms = Compose([Resize((224, 224)), ToTensor()])
        else:
            self.transforms = transforms
        
    def __len__(self):
        return len(self.x)
    
    def __getitem__(self, idx):
        img = Image.open(self.x[idx])
        img = self.transforms(img)       
        return img, torch.tensor([[self.y[idx]]])

结果运行时报错：RuntimeError: invalid argument 0: Sizes of tensors must match except in dimension 0. Got 3 and 1 in dimension 1 at /opt/conda/conda-bld/pytorch_1522182087074/work/torch/lib/TH/generic/THTensorMath.c:2897

Google了一下发现是这样的：读入的图片有些是灰度图（1个通道），绝大多数是RGB图片（3通道），也有些是带透明度的（4通道）。这导致在读入后最后一个维度（通道数）不一致（可能是1、3或者4）。Dataloader在制作batch data时，tensor的shape必须一样，就报了这个错误。解决的方法是：img = img.convert(“RGB”)。完整代码如下：

class psDataset(Dataset):
    def __init__(self, x, y, transforms = None):
        super(Dataset, self).__init__()
        self.x = x
        self.y = y
        if transforms == None:
            self.transforms = Compose([Resize((224, 224)), ToTensor()])
        else:
            self.transforms = transforms
        
    def __len__(self):
        return len(self.x)
    
    def __getitem__(self, idx):
        img = Image.open(self.x[idx])
        img = img.convert("RGB")
        img = self.transforms(img)       
        return img, torch.tensor([[self.y[idx]]])

xgbm_k

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
使用PyTorch中Dataset和Dataloader遇到的问题

今天在使用PyTorch中Dataset遇到了一个问题。先看代码class psDataset(Dataset): def __init__(self, x, y, transforms = None): super(Dataset, self).__init__() self.x = x self.y = y if tra...
复制链接

扫一扫