Torch建立数据迭代器进行训练的两种方法

最新推荐文章于 2023-12-20 10:23:30 发布

秋寒叶落

最新推荐文章于 2023-12-20 10:23:30 发布

阅读量1.4k

点赞数 3

文章标签： pycharm

本文链接：https://blog.csdn.net/weixin_43125467/article/details/107517414

版权

Torch建立数据迭代器进行网络模型训练的两种方法

数据库的建立
方法一
方法二

数据库的建立

数据格式要求：.csv文件，第一列为标签，第二列之后为数据在这里插入图片描述
建立数据库代码

import torch
import pandas as pd
import torch.utils.data as Data

def dataset(path):
    data = pd.read_csv(path,header=None)
    label = data.iloc[:, 0]
    data = data.iloc[:, 1:]
    label = torch.from_numpy(label.values.reshape(len(label))).type(torch.LongTensor)
    data = torch.from_numpy(data.values.astype(float).reshape(len(data), 1, len(data.loc[0]))).type(torch.FloatTensor)
    dataset = Data.TensorDataset(data, label)
    return dataset

path = './example.csv'
source_loader = Data.DataLoader(dataset=dataset(path), batch_size=8, shuffle=True, drop_last = True)

方法一

在训练和测试时需要调用建立的数据库，使用iter方法逐行调用

from torch.autograd import Variable

for epoch in range(1,EPOCH+1):
    # 开始训练
    # 模型model需要提前声明***
	model.train()
    iter_source = iter(source_loader)
    num_iter = len(source_loader)
    for i in range(0, num_iter):
        data, label = iter_source.next()
        if torch.cuda.is_available():
            data, label = data.cuda(), label.cuda()
        data, label = Variable(data), Variable(label)
        # 到此为止，数据调用完成，开始训练
        # 优化器optimizer需要提前声明***
        optimizer.zero_grad()
        preds = model(data)
        # 损失函数loss_func需要提前声明***
        loss= loss_func(preds, label)
        loss.backward()
        optimizer.step() 
        
    # 开始测试，test_loader同source_loader相同，需要提前定义***
    model.eval()
    iter_target = iter(test_loader)
    num_iter = len(test_loader)
    for i in range(0, num_iter):
        data, label = iter_target.next()
        if torch.cuda.is_available():
            data, label = data.cuda(), label.cuda()
        # 测试模式下不需要训练梯度
        with torch.no_grad():
            data, label = Variable(data), Variable(label)
        preds = model(data)
        loss = loss_func(target_preds, source_label)

方法二

使用enumerate方法调用数据库，直接使用cuda类型的数据，使用CPU训练需要修改格式

for epoch in range(1,EPOCH+1):
    model.train() 
    for step1,(data, label) in enumerate(train_loader):
        data = Variable(data.type('torch.cuda.FloatTensor'))
        label = Variable(label.type('torch.cuda.LongTensor'))
        optimizer.zero_grad()
        preds = model(data)
        loss = loss_func(preds, label)
        loss.backward()
        optimizer.step()  
    model.eval()     
    for step2,(data, label) in enumerate(test_loader):
        with torch.no_grad():
            data = Variable(data.type('torch.cuda.FloatTensor'))
            label = label.type('torch.cuda.LongTensor')
        preds = model(data)
        loss = loss_func(output, label)

秋寒叶落

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Torch建立数据迭代器进行训练的两种方法

Torch建立数据迭代器进行网络模型训练的两种方法数据库的建立方法一方法二数据库的建立数据格式要求：.csv文件，第一列为标签，第二列之后为数据建立数据库代码import torchimport pandas as pdimport torch.utils.data as Datadef dataset(path): data = pd.read_csv(path,header=None) label = data.iloc[:, 0] data = data.ilo
复制链接

扫一扫