从0开始训练一个大模型,跑通chatgpt所有流程

今天介绍一个我的github开源项目:Zero-Chatgpt(https://github.com/AI-Study-Han/Zero-Chatgpt)。
在这里插入图片描述
这个项目包含从 1、数据收集 -> 2、数据清洗和去重 -> 3、词表训练 -> 4、语言模型预训练 -> 5、指令微调 -> 6、强化学习(rlhf,ppo)所有需要的****数据(环境)介绍、运行脚本和代码,并且兼容huggingface格式。如果需要的话可以直接联系作者,运行的镜像也可以直接提供。根据这个项目,你只需要收集自己的数据就可以直接跑一个你自己的大模型,可以根据你自己手边的计算资源自由的缩放模型和数据大小。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值