万元预算打造高质量13B私有模型，Colossal-AI LLaMA-2 开源方案再升级

最新推荐文章于 2025-03-08 13:51:56 发布

潞晨科技官方

最新推荐文章于 2025-03-08 13:51:56 发布

阅读量1.3k

点赞数 21

分类专栏： Colossal-LLaMA-2 文章标签： llama

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/luchentech/article/details/135593865

版权

几个月前，Colossal-AI 团队仅利用8.5B token数据、15小时、数千元的训练成本，成功构建了性能卓越的中文LLaMA-2 7B 版本模型，在多个评测榜单性能优越。

在原有训练方案的基础上，Colossal-AI 团队再次迭代，并通过构建更为细致完善的数据体系，利用 25B token 的数据，打造了效果更佳的 13B 模型，并开源相关权重。

开源代码与权重：https://github.com/hpcaitech/ColossalAI

性能表现

注：基于ColossalEval评分，括号中分数来源于对应模型官方发布的榜单分数，C-Eval 分数来源于官网 Leaderboard。

在英文 MMLU 榜单中，Colossal-LLaMA-2-13B-base 在低成本增量预训练的加持下，英文效果稳中有升。在 GSM8k 的评估中发现，英文数学与推理能力有了显著的提升（31.31 -> 58.83）ÿ

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。