从头训练一个数学编程大模型

46 篇文章 9 订阅 ¥19.90 ¥99.00

一、前言

前段时间基于OLMO 框架利用8张卡从头训练一个1B 大模型,以本文做一个简单的工作总结。SFT 微调采用LLaMA-Factory,评测使用OpenCompass 。大模型面向的任务:能写代码,能做简单的数学题。

二、训练

预训练

预训练语料的数据配比主要参考现有大模型预训练数据来源及分布,数据主要来源于Dolma 数据集。其中,Dolma 数据集中中文语料比较欠缺,因而补充WuDao 中文数据集。大模型 预训练语料来源以及配比情况如下:

数据集 类型 token数量(B) 采样比例
CC 通用网页 19 2%
C4 通用网页 19 14%
wiki 专业网页与书籍 3.7 100%
WuDao 中文网页 19
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
从头开始系统地深入学习网络,您可以按照以下步骤进行: 1. 学习基础数学知识:深入学习网络需要一定的数学基础,包括线性代数、概率论和微积分等。学习这些数学概念将帮助您理解网络背后的原理和算法。 2. 了解机器学习和深度学习:深度学习是机器学习的一个重要分支,了解机器学习和深度学习的基本概念、算法和应用场景。阅读相关的书籍、论文或参加在线课程可以帮助您建立起扎实的基础。 3. 掌握Python编程语言:Python是深度学习领域常用的编程语言,熟悉Python编程将为您后续的深度学习实践提供便利。学习Python的基本语法、常用库(如NumPy、Pandas和Matplotlib等)以及深度学习框架(如TensorFlow、PyTorch等)的使用。 4. 学习神经网络基础:深入学习网络首先需要了解神经网络的基本原理和结构。学习神经元、激活函数、前向传播、反向传播等概念,并了解常见的神经网络结构,如全连接神经网络、卷积神经网络和循环神经网络等。 5. 实践构建和训练神经网络模型:通过实践构建和训练神经网络模型,将理论知识转化为实际操作能力。可以从简单的示例开始,逐步掌握数据预处理、模型构建、参数优化等步骤,并逐渐尝试更复杂的任务和模型。 6. 深入学习常见的深度学习模型和算法:学习常见的深度学习模型和算法,如卷积神经网络(CNN)、循环神经网络(RNN)、生成对抗网络(GAN)等。了解它们的原理、应用场景和实现细节。 7. 阅读相关论文和书籍:通过阅读相关领域的论文和书籍,了解最新的研究成果和进展。深入学习网络需要不断地更新知识,并跟踪领域的最新动态。 8. 参与实际项目和竞赛:参与实际项目或者参加机器学习竞赛,将有助于您在实践中巩固所学知识,并提升解决实际问题的能力。 9. 继续学习和探索:深度学习是一个不断发展的领域,持续学习和探索是深入学习网络的关键。参加学术会议、加入相关社区讨论或与其他从业者交流,可以帮助您与行业保持同步,并不断拓展自己的知识边界。 总之,深入学习网络需要扎实的数学基础、机器学习和深度学习的理论知识,并结合实践进行巩固和应用。通过不断学习、实践和探索,您将逐渐掌握深度学习网络的原理、算法和应用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

浅唱书令

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值