tensorflow_Trax_transformer使用示例

最新推荐文章于 2024-08-14 13:59:47 发布

SUN_SU3

最新推荐文章于 2024-08-14 13:59:47 发布

阅读量923

点赞数

分类专栏： NLP 文章标签： NLP

本文链接：https://blog.csdn.net/u013546508/article/details/106115134

版权

本文介绍了如何在Trax库中使用Transformer模型，包括数据预处理、模型构建和训练过程，特别强调了模型首次编译时的时间消耗问题。

摘要由CSDN通过智能技术生成

数据准备

Trax中没有写好的数据数据预处理脚本，所以要自己写数据预处理的过程，这里我就直接使用tensorflow_official_nlp_transformer使用示例中生成TTRecoard数据

# 获取训练语料
batch_size = 8
max_length = 100
static_batch = True
model_dir = './data_dir/trax_nlp/train_dir/'
_READ_RECORD_BUFFER = 8*1000*1000

def _load_records(filename):
    """Read file and return a dataset of tf.Examples."""
    return tf.data.TFRecordDataset(filename, buffer_size=_READ_RECORD_BUFFER)

def _parse_example(serialized_example):
    """Return inputs and targets Tensors from a serialized tf.Example."""
    data_fields = {
   
      "inputs": tf.io.VarLenFeature(tf