Qwen2-Math:人工智能数学天才的新时代

阿里巴巴云的 Qwen 团队推出了 Qwen2-Math 系列大型语言模型,专门用于解决复杂的数学问题。其特点是数学问题准确率高。Qwen2-Math是 "Qwen2 "系列的衍生模型,以 "Qwen2生成的数学相关信息 "作为学习数据。

并且这些建立在现有 Qwen2 基础上的新模型在解决算术和数学难题方面表现出了非凡的能力,并超越了以前的行业领先者。

Qwen 团队使用庞大而多样的数学专用语料库精心打造了 Qwen2-Math。该语料库由丰富的高质量资源组成,包括网络文本、书籍、代码、试题以及由 Qwen2 本身生成的合成数据。

在中英文数学基准(包括 GSM8K、Math、MMLU-STEM、CMATH 和高考数学)上进行的严格评估显示了 Qwen2-Math 的卓越能力。值得一提的是,旗舰机型 Qwen2-Math-72B-Instruct 在各种数学任务中的表现超过了 GPT-4o 和 Claude 3.5 等专有机型。

在这里插入图片描述
Qwen2-Math 有基本模型 “Qwen2-Math-1.5B”、"Qwen2-Math-7B "和 “Qwen2-Math-72B”,以及命令调整模型 “Qwen2-Math-1.5B-Instruct”、"Qwen2-Math-7B-Instruct "和 “Qwen2-Math-72B-Instruct”。从图中可以看出,"Qwen2-Math-72B-Instruct "的数学解题能力高于 “GPT-4o”、“Claude-3.5-Sonnet”、"Gemini-1.5-Pro "和 "Llama-3.1-405B "等模型。

介绍 Qwen2-Math | Qwen
https://qwenlm.github.io/blog/qwen2-math/

QwenLM/Qwen2-Math:我们的 Qwen2 系列中的一系列数学专用大型语言模型。
https://github.com/QwenLM/Qwen2-Math

以下是大规模语言模型的数学性能基准测试结果。即使是在 Qwen2-Math 指令调整模型中参数最少的 “Qwen2-Math-1.5B-Instruct”,也在大多数基准测试中优于 “Llama-3.1-70B-Instruct”。
在这里插入图片描述

在撰写本文时,Qwen2-Math 只支持英文,中文版将很快发布。各模型可从以下链接获取。

Qwen (Qwen)
https://huggingface.co/Qwen

在这里插入图片描述
感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

  • 10
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值