Pytorch自定义数据集

自定义数据集的代码如下:

import os
import pandas as pd
from torchvision.io import read_image

class CustomImageDataset(Dataset):
    def __init__(self, annotations_file, img_dir, transform=None, target_transform=None):
        self.img_labels = pd.read_csv(annotations_file)
        self.img_dir = img_dir
        self.transform = transform
        self.target_transform = target_transform

    def __len__(self):
        return len(self.img_labels)

    def __getitem__(self, idx):
        img_path = os.path.join(self.img_dir, self.img_labels.iloc[idx, 0])
        image = read_image(img_path)
        label = self.img_labels.iloc[idx, 1]
     #如果需要transform。则这里传入class当中的transform函数进行transform if self.transform: image = self.transform(image)
     #另一种transform if self.target_transform: label = self.target_transform(label)
      #先返回每一张图片,然后再返回当前图片的label return image, label

现在我们的自定义数据集即将做好了,然后使用dataloader模块打包数据集:

from torch.utils.data import DataLoader

train_dataloader = DataLoader(CustomImageDataset(annotations_file, img_dir, transform=None, target_transform=None), batch_size=64, shuffle=True) 
test_dataloader = DataLoader(CustomImageDataset(annotations_file, img_dir, transform=None, target_transform=None) batch_size=64, shuffle=True)

接下来就可以开始训练啦!!!

train fuction的代码:

def train(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)
    model.train()
    for batch, (X, y) in enumerate(dataloader):
        X, y = X.to(device), y.to(device)

        # Compute prediction error
        pred = model(X)
        loss = loss_fn(pred, y)

        # Backpropagation
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if batch % 100 == 0:
            loss, current = loss.item(), batch * len(X)
            print(f"loss: {loss:>7f}  [{current:>5d}/{size:>5d}]")

test function的代码:

def test(dataloader, model, loss_fn):
    size = len(dataloader.dataset)
    num_batches = len(dataloader)
    model.eval()
    test_loss, correct = 0, 0
    with torch.no_grad():
        for X, y in dataloader:
            X, y = X.to(device), y.to(device)
            pred = model(X)
            test_loss += loss_fn(pred, y).item()
            correct += (pred.argmax(1) == y).type(torch.float).sum().item()
    test_loss /= num_batches
    correct /= size
    print(f"Test Error: \n Accuracy: {(100*correct):>0.1f}%, Avg loss: {test_loss:>8f} \n")

一共使用5个epoch。因此代码如下:

epochs = 5
for t in range(epochs):
    print(f"Epoch {t+1}\n-------------------------------")
    train(train_dataloader, model, loss_fn, optimizer)
    test(test_dataloader, model, loss_fn)
print("Done!")
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PyTorch允许您创建自定义数据集以便于加载和处理您自己的数据。以下是一个简单的示例来创建自定义数据集: 首先,您需要导入必要的库: ```python import torch from torch.utils.data import Dataset ``` 然后,创建一个继承自`Dataset`类的自定义数据集类,并实现以下方法: - `__init__`:初始化数据集,例如加载数据或设置转换。 - `__len__`:返回数据集的大小。 - `__getitem__`:根据给定的索引返回一个样本。 下面是一个示例,假设您有一组图像数据和相应的标签: ```python class CustomDataset(Dataset): def __init__(self, data, labels): self.data = data self.labels = labels def __len__(self): return len(self.data) def __getitem__(self, index): sample = self.data[index] label = self.labels[index] # 在这里进行必要的数据转换 return sample, label ``` 在上面的示例中,`data`是图像数据的列表,`labels`是相应的标签的列表。然后,您可以在`__getitem__`方法中执行必要的数据转换,例如将图像转换为张量或应用任何其他预处理步骤。 要使用自定义数据集,您可以创建一个实例并将其传递给`DataLoader`类: ```python # 假设您有图像数据和标签 data = [...] # 图像数据列表 labels = [...] # 标签列表 # 创建自定义数据集实例 dataset = CustomDataset(data, labels) # 创建数据加载器 dataloader = torch.utils.data.DataLoader(dataset, batch_size=32, shuffle=True) ``` 现在,您可以使用`dataloader`来迭代加载批量的数据,并在训练模型时使用它们。 这只是一个简单的示例,您可以根据您的需求进行更多的自定义和扩展。希望这可以帮助到您!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值