train增加loss图表

最新推荐文章于 2024-10-07 06:31:57 发布

萧木易

最新推荐文章于 2024-10-07 06:31:57 发布

阅读量55

点赞数

分类专栏：人工智能文章标签：人工智能 pytorch

本文链接：https://blog.csdn.net/weixin_43997319/article/details/141926945

版权

人工智能专栏收录该内容

13 篇文章 0 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

# encoding: utf-8
from gpt_model import GPTConfig, GPTModel
import numpy as np
import sys
import torch
from data_set import load_tokenizer

device = 'cuda' if torch.cuda.is_available() else 'cpu'
learning_rate = 1e-3
max_iters = 500

# 使用numpy的memmap读取数据
train_data = np.memmap('train.dat', dtype=np.int32, mode='r')
test_data = np.memmap('test.dat', dtype=np.int32, mode='r')


def get_batch(split, config):
    data = train_data if split == "train" else test_data
    ix = torch.randint(0, len(data) - config.seq_len, (config.batch_size,))
    x = torch.stack([torch.from_numpy(data[i:i + config.seq_len].astype(np.int32)) for i in ix])
    y =

了解本专栏