论文翻译:QWEN2 TECHNICAL REPORT

https://arxiv.org/pdf/2407.10671

QWEN2 技术报告

摘要

本报告介绍了Qwen2系列,这是我们大型语言模型和大型多模态模型的最新成员。我们发布了一套全面的
基础和指令调优语言模型,涵盖了从0.5亿到720亿的参数范围,包括密集模型和专家混合模型。Qwen2超越了大多数以前的开放权重模型,包括其前身
Qwen1.5,并在语言理解、生成、多语种熟练度、编程、数学和推理等多样化基准上展现出与专有模型相竞争的性能。
旗舰模型,Qwen2-72B,展示了卓越的性能:在MMLU上得分84.2,在GPQA上得分37.9,在HumanEval上得分64.6,在GSM8K上得分89.5,在BBH上得分82.4,作为基础语言模型。指令调优变体,Qwen2-72B-Instruct,在MT-Bench上获得9.1,在Arena-Hard上获得48.1,在LiveCodeBench上获得35.7。此外,
Qwen2展示了强大的多语言能力,精通大约30种语言,涵盖英语、中文、西班牙语、法语、德语、阿拉伯语、俄语、韩语、日语、

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值