《PyTorch深度学习实践》8.加载数据集

大佬养成中

已于 2023-04-17 20:13:11 修改

阅读量58

点赞数

分类专栏： pytorch刘二大人文章标签：深度学习 pytorch 人工智能 Powered by 金山文档

于 2023-03-20 15:07:50 首次发布

本文链接：https://blog.csdn.net/Caoyuanyang/article/details/129628527

版权

pytorch刘二大人专栏收录该内容

10 篇文章 0 订阅

订阅专栏

batch的目的是为了更好的获得模型处理速度

所有的数据跑完一轮才是一个epoch

epoch:所有的数据均进行一次前向传播和一次反向传播

Batch-size:进行一次前馈或反馈的训练样本数量

Iteration: 内层迭代了多少次，也就是batch。iteration * Batch-size =所有样本量

这里__getitem__指的是为数据建立一个索引，方便以后使用（魔法函数）

__len__为的是获得数据的长度（魔法函数），即数量

num_workers是提高读取效率，提升速度.多线程来进行并行化。

由于多并行处理的时候会导致windows出错

必须加上If __name__ == "__main__":

import torch
import numpy as np
from torch.utils.data import Dataset
from torch.utils.data import DataLoader


# prepare dataset


class DiabetesDataset(Dataset):
    def __init__(self, filepath):
        xy = np.loadtxt(filepath, delimiter=',', dtype=np.float32)
        self.len = xy.shape[0]  # shape(多少行，多少列)
        self.x_data = torch.from_numpy(xy[:, :-1])
        self.y_data = torch.from_numpy(xy[:, [-1]])

    def __getitem__(self, index):
        return self.x_data[index], self.y_data[index]

    def __len__(self):
        return self.len


dataset = DiabetesDataset('diabetes.csv')
train_loader = DataLoader(dataset=dataset, batch_size=32, shuffle=True, num_workers=0)  # num_workers 多线程


# design model using class


class Model(torch.nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.linear1 = torch.nn.Linear(8, 6)
        self.linear2 = torch.nn.Linear(6, 4)
        self.linear3 = torch.nn.Linear(4, 1)
        self.sigmoid = torch.nn.Sigmoid()

    def forward(self, x):
        x = self.sigmoid(self.linear1(x))
        x = self.sigmoid(self.linear2(x))
        x = self.sigmoid(self.linear3(x))
        return x


model = Model()

# construct loss and optimizer
criterion = torch.nn.BCELoss(size_average=False)
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

# training cycle forward, backward, update
if __name__ == '__main__':
    for epoch in range(100):
        for i, data in enumerate(train_loader, 0):  # train_loader 是先shuffle后mini_batch
            inputs, labels = data
            y_pred = model(inputs)
            loss = criterion(y_pred, labels)
            print(epoch, i, loss.item())

            optimizer.zero_grad()
            loss.backward()

            optimizer.step()