torch训练模板

最新推荐文章于 2024-06-24 11:43:04 发布

Young Panda

最新推荐文章于 2024-06-24 11:43:04 发布

阅读量576

点赞数

分类专栏：人工智能文本分类

本文链接：https://blog.csdn.net/qq_28969139/article/details/107282325

版权

文本分类同时被 2 个专栏收录

13 篇文章 7 订阅

订阅专栏

人工智能

6 篇文章 0 订阅

订阅专栏

如题

from text_semantic.model import TextBiLSTM
from text_semantic.dataset import MyDataset
from text_semantic.config import TEMP_PATH, RECORD_PATH

import time
import torch
import numpy as np
from torch import nn
from torch.utils.data import DataLoader


def train_eval(cate, data_loader, model, optimizer, loss_func):
    model.train() if cate == 'train' else model.eval()
    acc, loss_sum = 0.0, 0.0
    for i, (x, target) in enumerate(data_loader):
        x, target = x.cuda(), target.cuda()
        y = model(x)
        loss = loss_func(y, target)
        if cate == 'train':
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
        acc += y.max(dim=1)[1].eq(target).sum().data
        loss_sum += loss.data
    acc = acc * 100 / len(data_loader.dataset)
    loss_sum = loss_sum / len(data_loader)
    return acc, loss_sum


if __name__ == '__main__':
    num_words = 35131
    num_classes = 20
    embedding_dim = 300
    hidden_size = 100
    dropout = 0.2
    word2vec = np.load(TEMP_PATH + '/done-word2vec.npy')
    padding_len = 400

    start = 45
    batch_size = 512
    lr = 1e-5

    print("init & load...")
    train_data = DataLoader(MyDataset('train', padding_len, num_words), batch_size=batch_size, shuffle=True)
    test_data = DataLoader(MyDataset('test', padding_len, num_words), batch_size=batch_size)

    model = TextBiLSTM(num_words, num_classes, embedding_dim, hidden_size, word2vec, dropout)
    if start != 0: model.load_state_dict(torch.load(RECORD_PATH + '/model.{}.pth'.format(start)))
    loss_func = nn.CrossEntropyLoss()
    optimizer = torch.optim.Adam(model.parameters(), lr=lr)

    print("start...")
    model = model.cuda()
    for epoch in range(start + 1, 200):
        t1 = time.time()
        train_acc, train_loss = train_eval('train', train_data, model, optimizer, loss_func)
        test_acc, test_loss = train_eval('test', test_data, model, optimizer, loss_func)
        cost = time.time() - t1
        torch.save(model.state_dict(), RECORD_PATH + '/model.{}.pth'.format(epoch))
        print("epoch=%s, cost=%.2f, train:[loss=%.4f, acc=%.2f%%], test:[loss=%.4f, acc=%.2f%%]"
              % (epoch, cost, train_loss, train_acc, test_loss, test_acc))

Young Panda

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
torch训练模板

如题from text_semantic.model import TextBiLSTMfrom text_semantic.dataset import MyDatasetfrom text_semantic.config import TEMP_PATH, RECORD_PATHimport timeimport torchimport numpy as npfrom torch import nnfrom torch.utils.data import DataLoader.
复制链接

扫一扫

专栏目录