python-中文闲聊的GPT2模型首次使用笔记

本文介绍了如何使用Python运行和训练GPT2模型进行中文闲聊。项目地址位于GitHub,包括模型下载、运行已训练模型的步骤以及数据预处理和模型训练的方法。
摘要由CSDN通过智能技术生成

项目地址

https://github.com/yangjianxin1/GPT2-chitchat

运行项目

  1. 下载bin模型地址
    https://github.com/yangjianxin1/GPT2-chitchat#model_share
  2. 将下载的模型放在model文件夹中或者model/epoch40中
  3. 运行已经训练好的模型
python interact.py --no_cuda --model_path model_epoch40_50w (使用cpu生成,速度相对较慢)
或
python interact.py --model_path model_epoch40_50w --device 0 (指定0号GPU进行生成,速度相对较快)

如何准备自己的资料

  1. 文本格式
    参照项目的数据预处理
  2. 预处理后进行tokenize
    参照项目的数据预处理
python preprocess.py --train_path data/train.txt --save_path data/train.pkl
  1. 拿到pkl后训练模型
    参照项目的训练模型章节,就会得到bin模型
python train.py --epochs 40 --batch_size 8 --device 0,1 --train_path data/train.pkl
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值