让AI写个作文康康 | GPT2中文项目的部署和自定义语料的训练

本文介绍了如何部署和训练GPT2-Chinese项目,包括下载项目、环境配置、测试模型、自定义语料训练及超参数优化。作者通过实践发现,合适的模型配置和优化策略对于训练效果至关重要,降低multi-head,增加embed大小,优化batch数量,可以提高训练效率和生成质量。
摘要由CSDN通过智能技术生成

有的时候我都快忘了我是做CV的~

但是NLP实在是太有意思了~

项目主要基于GPT2-Chinese项目,做了一些优化修改。

一、下载项目和数据

项目下载地址(原始项目):https://github.com/Morizeyao/GPT2-Chinese

体验模型:

①散文:使用130MB的名家散文、情感散文和散文诗歌训练所得 。百度网盘 fpyu

②诗词:使用180MB的约80万首古诗词训练所得。百度网盘 7fev

③对联:使用40MB的约70万条对联训练所的。百度网盘 i5n0

--------------------------------------------------------------------------------------------------

项目下载地址(部分优化):https://download.csdn.net/download/Andrwin/14753828

做了个刘慈欣的44本科幻书籍语料:https://download.csdn.net/download/Andrwin/14753828

效果:(语料太小了就6.6M,效果并不是特别好,0.1<=loss<=1.0)

二、环境配置

不需要Apex,这个东西并没有什么卵用,显存占用确实小了一丢丢,也就不到一百兆,训练时间可能需要翻倍。

sentencepiece需要单独

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值