有的时候我都快忘了我是做CV的~
但是NLP实在是太有意思了~
项目主要基于GPT2-Chinese项目,做了一些优化修改。
一、下载项目和数据
项目下载地址(原始项目):https://github.com/Morizeyao/GPT2-Chinese
体验模型:
①散文:使用130MB的名家散文、情感散文和散文诗歌训练所得 。百度网盘 fpyu
②诗词:使用180MB的约80万首古诗词训练所得。百度网盘 7fev
③对联:使用40MB的约70万条对联训练所的。百度网盘 i5n0
--------------------------------------------------------------------------------------------------
项目下载地址(部分优化):https://download.csdn.net/download/Andrwin/14753828
做了个刘慈欣的44本科幻书籍语料:https://download.csdn.net/download/Andrwin/14753828
效果:(语料太小了就6.6M,效果并不是特别好,0.1<=loss<=1.0)
二、环境配置
不需要Apex,这个东西并没有什么卵用,显存占用确实小了一丢丢,也就不到一百兆,训练时间可能需要翻倍。
sentencepiece需要单独