pytorch手写dataset

最新推荐文章于 2024-09-01 15:36:46 发布

喝过期的拉菲

最新推荐文章于 2024-09-01 15:36:46 发布

阅读量653

点赞数 15

分类专栏： chatgpt 深度学习 Python 文章标签： pytorch 人工智能 python

本文链接：https://blog.csdn.net/qq_49323609/article/details/137177191

版权

Python 同时被 3 个专栏收录

21 篇文章 0 订阅

订阅专栏

深度学习

18 篇文章 1 订阅

订阅专栏

chatgpt

3 篇文章 0 订阅

订阅专栏

pytorch手写dataset

当你创建一个PyTorch自定义的Dataset类时，你需要继承torch.utils.data.Dataset类，并实现__len__和__getitem__方法。下面是一个简单的示例，假设你的数据集包含特征和标签：

import torch
from torch.utils.data import Dataset

class CustomDataset(Dataset):
    def __init__(self, features, labels):
        self.features = features
        self.labels = labels
        
    def __len__(self):
        return len(self.features)
    
    def __getitem__(self, idx):
        feature = torch.tensor(self.features[idx], dtype=torch.float)
        label = torch.tensor(self.labels[idx], dtype=torch.long)
        return feature, label

在这个示例中，CustomDataset类接受特征和标签作为输入，并在__init__方法中进行初始化。__len__方法返回数据集的长度，__getitem__方法根据给定的索引返回对应的特征和标签。

你可以使用这个自定义的Dataset类来创建PyTorch的DataLoader，并将其用于训练模型。例如：

# 假设你有一组特征和标签数据
features = [[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]]
labels = [0, 1, 0]

# 创建自定义的Dataset
custom_dataset = CustomDataset(features, labels)

# 创建DataLoader
dataloader = torch.utils.data.DataLoader(custom_dataset, batch_size=2, shuffle=True)

# 遍历DataLoader
for inputs, targets in dataloader:
    # 在这里进行模型训练
    pass