虎博开源大模型TigerBot-70B发布

最新推荐文章于 2024-09-03 14:43:47 发布

Tigerbot

最新推荐文章于 2024-09-03 14:43:47 发布

阅读量890

点赞数 4

分类专栏： AIGC 大模型文章标签： AIGC 语言模型人工智能自然语言处理 nlp

本文链接：https://blog.csdn.net/Tigerobo/article/details/132720771

版权

TigerBot团队发布了Tigerbot-70b，这是一款在Llama-2-70b基础上预训练的模型，展现出在多项基准测试中的优越性能。利用300GB多语言数据，结合GQA、RoPE等先进技术，实现了计算效率和模型能力的平衡。此外，Tigerbot-70b-chat通过指令微调和人类标注数据对齐，提供出色的对话能力。模型在阅读理解、推理等多个NLP任务上达到SOTA水平。

摘要由CSDN通过智能技术生成

我们很高兴地发布Tigerbot-70b，继续开源和免费商用，包括：

Tigerbot-70b-base: 在Llama-2-70b的基础上继续预训练，模型综合能力在mmlu等10项主流基准测试中，优于Llama-2-70b，达到业内SOTA。
1. 用高质量的300GB token多语言数据，
2. 算法上使用了GQA, flash-attn, RoPE, holistic-training等技术，
3. 训练采用了tensor/pipeline-partition技术，计算效率达到Llama-2 paper中报告的SOTA。
Tigerbot-70b-chat: 在Tigerbot-70b-base基础上，用20M指令完成数据进行sft，和10K人类标注的gold set进行rejection-sampling对齐。
同步开放Tigerbot-70b-chat-api，继续对教育和科研开发者免费。

模型训练

Tigerbot-70b是在Llama-2-70b的基础上用高质量的多语言数据300B tokens继续预训练，如下图第一部分训练数据的收敛曲线所示，比之前7b和13b呈现出更好的loss收敛。

我们认为在算法出色的基础上，数据的质量直接影响到模型能力，因此，我们此次训练启用了新的数据mix

最低0.47元/天解锁文章

Tigerbot

关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
1
评论
虎博开源大模型TigerBot-70B发布

Tigerbot-70b-base: 在Llama-2-70b的基础上继续预训练，模型综合能力在mmlu等10项主流基准测试中，优于Llama-2-70b，达到业内SOTA。Tigerbot-70b-chat: 在Tigerbot-70b-base基础上，用20M指令完成数据进行sft，和10K人类标注的gold set进行rejection-sampling对齐。同步开放Tigerbot-70b-chat-api，继续对教育和科研开发者免费。
复制链接

扫一扫