预训练
408Killer
中国科学院大学硕士生初入机器学习领域,记录自己在项目中遇到的问题以及分享最后解决问题的方法。期待会对他人有所帮助!
展开
-
将markdown文件按句子切块转换成预训练格式
【代码】将markdown文件按句子切块转换成预训练格式。原创 2024-10-10 16:14:13 · 168 阅读 · 1 评论 -
大模型预训练记录
遇到的问题:训练崩掉了(模型不讲人话)。因为学习率太高需要调低点,lr=1e-5就可以,同时要修改loss更新的频率,不能没chunk都更新,大概4chunk一次更新差不多。前提:任务要求3w篇pdf文献用来预训练,采用MinerU转换为markdown格式,对markdown格式初步清洗用来预训练测试。选用qwen为基座模型,采用lora预训练。加载测试代码采用qwen官方的。原创 2024-10-10 15:11:48 · 320 阅读 · 0 评论