vivo AI Lab的最新力作:BlueLM大模型详细解析与评测

模型介绍

  • 数据规模与质量:BlueLM训练使用了高质量的语料库,总计达到2.6万亿token数。这个语料库包含中文、英文以及少量日韩数据。

  • 模型效果:BlueLM-7B-Chat在C-Eval和CMMLU上取得领先结果,与同尺寸的开源模型相比具有较强的竞争力。

  • 长文本支持:BlueLM-7B-Base-32K和BlueLM-7B-Chat-32K均支持32K长文本,能够在保持基础能力的同时支持更长上下文的理解。

  • 协议说明:BlueLM系列对开发者开放,可用于学术研究和商业应用。

图片

图片

评测结果

BlueLM的评测覆盖了多个领域和任务,包括通用能力、数学能力和代码能力的测试。具体评测结果如下:

  • C-Eval:全面的中文基础模型评测数据集,包含13948个多项选择题,涵盖52个学科和四个难度级别。

  • MMLU:包含57个子任务的英文评测数据集,涵盖初等数学、美国历史、计算机科学、法律等。

  • CMMLU:包含67个主题的中文评测数据集,涵盖自然科学、社会科学、工程、人文等。

  • 其他评测:包括Gaokao、AGIEval、BBH、GSM8K、MATH和HumanEval等。

图片

图片

参考资料

开源地址:https://github.com/vivo-ai-lab/BlueLM

国内模型下载:https://aifasthub.com/models/vivo-ai

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值