pytorch自定义数据集的写法

最新推荐文章于 2024-05-09 14:47:10 发布

资料加载中

最新推荐文章于 2024-05-09 14:47:10 发布

阅读量486

点赞数

分类专栏： pytorch 文章标签： pytorch 深度学习

本文链接：https://blog.csdn.net/qq_44091004/article/details/109592527

版权

pytorch 专栏收录该内容

8 篇文章 1 订阅

订阅专栏

1.自定义数据集继承于基类Dataset。
2.该类需要实现三个函数，分别为__init__()函数、len()函数、getitem()函数；第一个函数是初始化函数，初始化图片存储路径（列表的形式），第二个函数是获得图片的长度，第三个函数通过index（index是通过dataloader函数获取）加载路径中的图片，进行增强化处理，并获得该图片的标签，最后返回增强处理后的图片和标签。
3.transform的包装，通过compose()进行串行序列化包装，对图片进行顺序处理。
4.实例化自定义数据集类。

from PIL import Image
from torch.utils.data import Dataset
from torchvision import transforms

class TorchvisionDataset(Dataset):
    def __init__(self, file_paths, labels, transform=None):
        self.file_paths = file_paths
        self.labels = labels
        self.transform = transform
        
    def __len__(self):
        return len(self.file_paths)

    def __getitem__(self, idx):
        label = self.labels[idx]
        file_path = self.file_paths[idx]
        
        # Read an image with PIL
        image = Image.open(file_path)
        if self.transform:
            image = self.transform(image)
        return image, label


torchvision_transform = transforms.Compose([
    transforms.Resize((256, 256)), 
    transforms.RandomCrop(224),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    transforms.Normalize(
        mean=[0.485, 0.456, 0.406],
        std=[0.229, 0.224, 0.225],
    )
])


torchvision_dataset = TorchvisionDataset(
    file_paths=['./images/image_1.jpg', './images/image_2.jpg', './images/image_3.jpg'],
    labels=[1, 2, 3],
    transform=torchvision_transform,
)

pytorch中自定义数据集的图片转换由torchvision换为albumentations,效果等同

import cv2
import albumentations as A
from albumentations.pytorch import ToTensorV2

class AlbumentationsDataset(Dataset):
    """__init__ and __len__ functions are the same as in TorchvisionDataset"""
    def __init__(self, file_paths, labels, transform=None):
        self.file_paths = file_paths
        self.labels = labels
        self.transform = transform
        
    def __len__(self):
        return len(self.file_paths)

    def __getitem__(self, idx):
        label = self.labels[idx]
        file_path = self.file_paths[idx]
        
        # Read an image with OpenCV
        image = cv2.imread(file_path)
        
        # By default OpenCV uses BGR color space for color images,
        # so we need to convert the image to RGB color space.
        image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
        if self.transform:
            augmented = self.transform(image=image)
            image = augmented['image']
        return image, label


albumentations_transform = A.Compose([
    A.Resize(256, 256), 
    A.RandomCrop(224, 224),
    A.HorizontalFlip(),
    A.Normalize(
        mean=[0.485, 0.456, 0.406],
        std=[0.229, 0.224, 0.225],
    ),
    ToTensorV2()
])


albumentations_dataset = AlbumentationsDataset(
    file_paths=['./images/image_1.jpg', './images/image_2.jpg', './images/image_3.jpg'],
    labels=[1, 2, 3],
    transform=albumentations_transform,
)

将albumentions中的cv2换为PIL

from PIL import Image
import numpy as np
import albumentations as A
from albumentations.pytorch import ToTensorV2

class AlbumentationsPilDataset(Dataset):
    """__init__ and __len__ functions are the same as in TorchvisionDataset"""
    def __init__(self, file_paths, labels, transform=None):
        self.file_paths = file_paths
        self.labels = labels
        self.transform = transform
        
    def __len__(self):
        return len(self.file_paths)

    def __getitem__(self, idx):
        label = self.labels[idx]
        file_path = self.file_paths[idx]

        image = Image.open(file_path)
        
        if self.transform:
            # Convert PIL image to numpy array
            image_np = np.array(image)
            # Apply transformations
            augmented = self.transform(image=image_np)
            # Convert numpy array to PIL Image
            image = Image.fromarray(augmented['image'])
        return image, label


albumentations_pil_transform = A.Compose([
    A.Resize(256, 256), 
    A.RandomCrop(224, 224),
    A.HorizontalFlip(),
])


# Note that this dataset will output PIL images and not numpy arrays nor PyTorch tensors
albumentations_pil_dataset = AlbumentationsPilDataset(
    file_paths=['./images/image_1.jpg', './images/image_2.jpg', './images/image_3.jpg'],
    labels=[1, 2, 3],
    transform=albumentations_pil_transform,
)

参考：https://github.com/albumentations-team/albumentations_examples/blob/

资料加载中

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
pytorch自定义数据集的写法

1.自定义数据集继承于基类Dataset。2.该类需要实现三个函数，分别为__init__()、len()、getitem()；第一个函数是初始化函数，初始化图片存储路径（列表的形式），第二个函数是获得图片的长度，第三个函数通过index（index是通过dataloader函数获取）加载路径中的图片，进行增强化处理，并获得该图片的标签，最后返回增强处理后的图片和标签。3.transform的包装，通过compose()进行串行序列化包装，对图片进行顺序处理。4.实例化自定义数据集类。class T
复制链接

扫一扫