vivo AI Lab的最新力作：BlueLM大模型详细解析与评测

努力犯错

于 2023-11-13 16:08:52 发布

阅读量675

点赞数

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nulifancuoAI/article/details/134379925

版权

模型介绍

数据规模与质量：BlueLM训练使用了高质量的语料库，总计达到2.6万亿token数。这个语料库包含中文、英文以及少量日韩数据。
模型效果：BlueLM-7B-Chat在C-Eval和CMMLU上取得领先结果，与同尺寸的开源模型相比具有较强的竞争力。
长文本支持：BlueLM-7B-Base-32K和BlueLM-7B-Chat-32K均支持32K长文本，能够在保持基础能力的同时支持更长上下文的理解。
协议说明：BlueLM系列对开发者开放，可用于学术研究和商业应用。

评测结果

BlueLM的评测覆盖了多个领域和任务，包括通用能力、数学能力和代码能力的测试。具体评测结果如下：

C-Eval：全面的中文基础模型评测数据集，包含13948个多项选择题，涵盖52个学科和四个难度级别。
MMLU：包含57个子任务的英文评测数据集，涵盖初等数学、美国历史、计算机科学、法律等。
CMMLU：包含67个主题的中文评测数据集，涵盖自然科学、社会科学、工程、人文等。
其他评测：包括Gaokao、AGIEval、BBH、GSM8K、MATH和HumanEval等。

参考资料

开源地址：https://github.com/vivo-ai-lab/BlueLM

国内模型下载：https://aifasthub.com/models/vivo-ai

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。