从头训练一个数学编程大模型

浅唱书令

已于 2024-07-29 14:01:54 修改

阅读量61

点赞数

分类专栏：人工智能文章标签：大模型 llama olmo

于 2024-07-16 12:23:01 首次发布

本文链接：https://blog.csdn.net/keyboardlabourer/article/details/140463112

版权

46 篇文章 9 订阅 ¥19.90 ¥99.00

订阅专栏

一、前言

前段时间基于OLMO 框架利用8张卡从头训练一个1B 大模型，以本文做一个简单的工作总结。SFT 微调采用LLaMA-Factory，评测使用OpenCompass 。大模型面向的任务：能写代码，能做简单的数学题。

预训练语料的数据配比主要参考现有大模型预训练数据来源及分布，数据主要来源于Dolma 数据集。其中，Dolma 数据集中中文语料比较欠缺，因而补充WuDao 中文数据集。大模型预训练语料来源以及配比情况如下：

数据集	类型	token数量(B)	采样比例
CC	通用网页	19	2%
C4	通用网页	19	14%
wiki	专业网页与书籍	3.7	100%
WuDao	中文网页	19

了解本专栏

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注