GPT-2模型主要用于根据上下文,预测下一个最有可能的词汇。
基于开源的Transformers库,用GPT-2模型以无监督学习的方式训练文本:
- ①下载开源库:transformers
- ②根据要求安装tensorflow2.0、Pytorch1.0+等依赖的训练工具;
- ③如果需要使用GPU训练,还需要安装CUDA10.0、CUDNN7.x等组件;
- ④训练:transformers提供了方便的训练API接口,直接调用finetunning.py文件,选择所需要训练的模型、指定训练数据集、预测数据集即可开始训练;
- ⑤【注意】GPT-2模型训练的效果较好,但参数也较多,通常需要有GPU算力支持的电脑进行训练,另外在训练开始前需要联网下载GPT-2的预训练的参数文件;