通义千问重磅开源Qwen2.5，性能超越Llama

码流怪侠

已于 2024-09-20 17:50:02 修改

阅读量1.2k

点赞数 10

分类专栏： # 大模型来了文章标签： llama 大模型通义千问 Qwen 深度学习人工智能

于 2024-09-20 17:46:14 首次发布

本文链接：https://blog.csdn.net/yanceyxin/article/details/142390960

版权

大模型来了专栏收录该内容

11 篇文章

订阅专栏

Qwen2.5 新闻

9月19日云栖大会，阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5，旗舰模型Qwen2.5-72B性能超越Llama 405B，再登全球开源大模型王座。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型，每个尺寸都有基础版本、指令跟随版本、量化版本，总计上架100多个模型，刷新业界纪录。
Qwen2.5系列模型，特别是旗舰版本Qwen2.5-72B，凭借卓越的性能，成功超越了Facebook的Llama 405B。这一模型涵盖了多个尺寸的大语言模型、多模态模型、数学模型和代码模型，构建了一个丰富而多样化的模型生态体系。每个模型都提供基础版本、指令跟随版本和量化版本，总计上架并可供下载的模型达100多个，而截至2024年9月中旬，通义千问模型的累计下载量已经突破了4000万，成为仅次于Llama的世界级模型群。
“相比上一代模型，Qwen-Max在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐，最终达到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多个权威基准上，Qwen-Max表现接近GPT-4o，数学能力、代码能力则超越了GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。”周靖人称。
截至2024年9月中旬，通义千问开源模型下载量突破4000万，Qwen系列衍生模型总数超过5万个，成为仅次于Llama的世界级模型群。
Qwen 团队的最新发布包括了 Qwen2.5 语言模型，以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math 模型。