Qwen2.5 新闻
- 9月19日云栖大会,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,旗舰模型Qwen2.5-72B性能超越Llama 405B,再登全球开源大模型王座。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。
- Qwen2.5系列模型,特别是旗舰版本Qwen2.5-72B,凭借卓越的性能,成功超越了Facebook的Llama 405B。这一模型涵盖了多个尺寸的大语言模型、多模态模型、数学模型和代码模型,构建了一个丰富而多样化的模型生态体系。每个模型都提供基础版本、指令跟随版本和量化版本,总计上架并可供下载的模型达100多个,而截至2024年9月中旬,通义千问模型的累计下载量已经突破了4000万,成为仅次于Llama的世界级模型群。
- “相比上一代模型,Qwen-Max在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多个权威基准上,Qwen-Max表现接近GPT-4o,数学能力、代码能力则超越了GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。”周靖人称。
- 截至2024年9月中旬,通义千问开源模型下载量突破4000万,Qwen系列衍生模型总数超过5万个,成为仅次于Llama的世界级模型群。
- Qwen 团队的最新发布包括了 Qwen2.5 语言模型,以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math 模型。
网友观点
- 网友一:通义千问现在下载量这么高了,后续的服务和迭代能跟上吗?模型大了,需要的算力可不少,怎么保证性能不下滑?
- 网友二:通义千问这次开源Qwen2.5,真的挺期待的。但是,数据安全和隐私保护问题怎么解决?感觉这个是绕不开的大难题啊。
- 网友三:QWen 确实厉害。
- 网友四:阿里真的是有点东西!
- 网友五:感谢马云开源!
- 。。。