7_Dataset and DataLoader

传送门:08.加载数据集_哔哩哔哩_bilibili

Dataset 是为了构造数据集
DataLoader 拿出一个mini-batch
用mini-batch平衡训练速度和训练结果的一个需求
 

#training cycle
# for epoch in range(training_epochs):
#     # 取出一个mini-batch
#     for i in range(total_batch):

# 概念:iteration  内层的迭代一共进行了多少次

# DataLoader 需要支持索引,并且知道Dataset的长度
# shuffle 打乱顺序

import torch
import numpy as np
from torch.utils.data import Dataset  # 抽象类
from torch.utils.data import DataLoader  

class DiabetesDataset(Dataset):  # 糖尿病数据集
    def __init__(self,filepath): # filepath文件路径          
        xy = np.loadtxt(filepath, delimiter=',', dtype=np.float32)
        self.len = xy.shape[0] # shape(多少行,多少列)  在该例子下,拿到的是一个(n,9)的元组
        self.x_data = torch.from_numpy(xy[:, :-1])
        self.y_data = torch.from_numpy(xy[:, [-1]])

    
    def __getitem__(self, index):# 支持下标操作
        return self.x_data[index], self.y_data[index]   # 返回的是一个元组
    
    def __len__(self):           # 支持len()
        return self.len          # 在刚刚的__init__中实现的
    
dataset = DiabetesDataset(r'C:\Users\86196\Desktop\diabetes.csv.gz')
train_loader = DataLoader(dataset = dataset,  # 等号后的dataset是我们上一行实例化的,我们要把它穿进去
                          batch_size = 32,
                          shuffle = True,
                          num_workers = 0)


class Model(torch.nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.linear1 = torch.nn.Linear(8, 6)
        self.linear2 = torch.nn.Linear(6, 4)
        self.linear3 = torch.nn.Linear(4, 1)
        self.sigmoid = torch.nn.Sigmoid()
 
    def forward(self, x):
        x = self.sigmoid(self.linear1(x))
        x = self.sigmoid(self.linear2(x))
        x = self.sigmoid(self.linear3(x))
        return x
    
model = Model()


# construct loss and optimizer
criterion = torch.nn.BCELoss(reduction='mean')
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)


# 这行代码是一个常见的Python主程序入口。当当前脚本被直接运行时,'name'变量的值为'main'。
# 这行代码确保以下代码块只在当前脚本被直接执行时运行,而不是在作为模块被其他脚本导入时运行。
if __name__ == '__main__':    # 没有的话可能会报错
    for epoch in range(100):
        # 这行代码在每次训练循环中,获取train_loader(一个常用的在PyTorch中加载和准备数据的方法)中的一个数据块
        # 并通过enumerate函数获取该数据块的索引(i)和内容(data)。索引i从0开始。
        for i, data in enumerate(train_loader, 0): # train_loader 是先shuffle后mini_batch
            # 1.Prepare data
            inputs, labels = data   # inputs就是x,labels就是y
            # 2.Forward
            y_pred = model(inputs)
            loss = criterion(y_pred, labels)
            print(epoch, i, loss.item())    # 这行代码打印了当前的训练轮数(epoch),当前轮次中的数据块索引(i),以及该数据块的损失值
            # 3.Backward
            optimizer.zero_grad()
            loss.backward()
            # 4.Update
            optimizer.step()

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
dataset = CocoDetection(root=r'D:\file\study\data\COCO2017\train2017', annFile=r'D:\file\study\data\COCO2017\annotations\instances_train2017.json', transforms=transforms.Compose([transforms.ToTensor()])) # 定义训练集和测试集的比例 train_ratio = 0.8 test_ratio = 0.2 # 计算训练集和测试集的数据数量 num_data = len(dataset) num_train_data = int(num_data * train_ratio) num_test_data = num_data - num_train_data # 使用random_split函数将数据集划分为训练集和测试集 train_dataset, test_dataset = random_split(dataset, [num_train_data, num_test_data]) # 打印训练集和测试集的数据数量 print(f"Number of training data: {len(train_dataset)}") print(f"Number of test data: {len(test_dataset)}") train_loader = DataLoader(train_dataset, batch_size=8, shuffle=True, num_workers=0) test_loader = DataLoader(test_dataset, batch_size=8, shuffle=True, num_workers=0) # define the optimizer and the learning rate scheduler params = [p for p in model.parameters() if p.requires_grad] optimizer = torch.optim.SGD(params, lr=0.005, momentum=0.9, weight_decay=0.0005) lr_scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=3, gamma=0.1) # train the model for 10 epochs num_epochs = 10 for epoch in range(num_epochs): # 将模型设置为训练模式 model.train() # 初始化训练损失的累计值 train_loss = 0.0 # 构建一个迭代器,用于遍历数据集 for i, images, targets in train_loader: print(images) print(targets) # 将数据转移到设备上 images = list(image.to(device) for image in images) targets = [{k: v.to(device) for k, v in t.items()} for t in targets]上述代码报错:TypeError: call() takes 2 positional arguments but 3 were given
05-31

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值