train

萧木易

已于 2024-09-04 20:07:45 修改

阅读量235

点赞数

分类专栏：人工智能文章标签：人工智能 pytorch

于 2024-09-03 23:12:56 首次发布

本文链接：https://blog.csdn.net/weixin_43997319/article/details/141874249

版权

人工智能专栏收录该内容

11 篇文章 0 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

# encoding: utf-8
from gpt_model import GPTConfig, GPTModel
import numpy as np
import sys
import torch
from data_set import load_tokenizer

device = 'cuda' if torch.cuda.is_available() else 'cpu'
learning_rate = 1e-3
max_iters = 15000

# 使用numpy的memmap读取数据
train_data = np.memmap('train.dat', dtype=np.int32, mode='r')
test_data = np.memmap('test.dat', dtype=np.int32, mode='r')


def get_batch(split, config):
    data = train_data if split == "train" else test_data
    ix = torch.randint(0, len(data) - config.seq_len, (config.batch_size,))
    x = torch.stack([torch.from_numpy(data[i:i + config.seq_len].astype(np.int32)) for i in ix])
    y &#

了解本专栏