关于NLP模型GPT-2的学习笔记（三）

最新推荐文章于 2024-02-28 16:32:11 发布

bjwhile

最新推荐文章于 2024-02-28 16:32:11 发布

阅读量234

点赞数

分类专栏： Python 文章标签： python 深度学习自然语言处理 gpt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bjwhile/article/details/115037004

版权

Python 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

关于NLP模型GPT-2的学习笔记（三）

文章目录

关于NLP模型GPT-2的学习笔记（三）
前言
一、准备工作
二、文本生成
三、模型训练
总结

前言

前面主要介绍了GPT-2的基本原理和工作流程，本次会进行一些训练模型和模型使用的实践

一、准备工作

首先从github下载GPT-2的程序和部分已经训练好的模型

在下载好之后，将程序解压到制定位置，注意路径尽量不要包含中文

二、文本生成

我们先打开命令行设置路径到对应位置
在这里插入图片描述
在生成文本时，使用generate.py文件，其中有一些参数可以配置，在生成效果不好时可以调节，–save_samples用于保存生成的文本阳样例

三、模型训练

当进行模型训练时，使用train.py文件，在运行之前，要先选择需要训练的语料，在上面的连接中已经有可用的语料可以下载

下载好语料后，将语料放到/data/train.json文件中，注意要保证文件格式正确

做好准备工作后，就可以开始训练了，运行上一级目录的train.py开始训练，如果电脑性能不足，可以调低其中的部分参数
在这里插入图片描述
下面就是训练过程，等待全部结束就可以得到训练好的模型了

总结

到此为止本文简单介绍了GPT-2模型训练的操作方法，测试训练完成的模型的实际效果需要更多的实践来积累经验，后续会对于GPT模型进行更多的介绍。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。