阿里震撼发布Qwen2.5“全能套装”——打造史上最大规模开源盛宴

在 Qwen2 发布后的过去三个月里,许多开发者基于 Qwen2 语言模型构建了新的模型。9月19日阿里发布了 Qwen 家族的最新成员:Qwen2.5

在这里插入图片描述
在这里插入图片描述

模型版本

最新发布包括了语言模型 Qwen2.5,以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math 模型。所有开放权重的模型都是稠密的、decoder-only的语言模型,提供多种不同规模的版本,包括:

  • Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及72B;
  • Qwen2.5-Coder: 1.5B, 7B, 以及即将推出的32B;
  • Qwen2.5-Math: 1.5B, 7B, 以及72B。

除了3B和72B的版本外,所有的开源模型都采用了 Apache 2.0 许可证。

  • https://qwenlm.github.io/blog/qwen2.5-llm
  • https://qwenlm.github.io/blog/qwen2.5-coder
  • https://qwenlm.github.io/blog/qwen2.5-math

主要特色

Qwen2.5 语言模型更新:
  • 预训练数据集:使用包含高达 18T tokens 的最新大规模数据集进行预训练。
  • 知识扩展:相较于 Qwen2,Qwen2.5 在多项评估中显示出了更广泛的知识(MMLU:85+)。
  • 技能提升:在编程(HumanEval 85+)、数学(MATH 80+)方面有显著进步。
  • 功能增强:改善了指令执行、长文本生成(>8K 标记)、结构化数据理解和生成(如表格、JSON)的能力。
  • 适应性增强:对不同类型的系统提示更加适应,提高了角色扮演和聊天机器人设定的灵活性。
  • 多语言支持:支持 29 种以上的语言,包括但不限于中、英、法、西、葡、德、意、俄、日、韩等。
专业领域模型升级:
  • 编程模型 Qwen2.5-Coder:在包含 5.5T tokens 的编程数据集上训练,使得小规模模型在编程评估中表现出色。
  • 数学模型 Qwen2.5-Math:支持中文和英文,融合了多种推理方法,包括思考链(CoT)、思考程序(PoT)和工具集成推理(TIR)。

支持的工具

工具调用支持:
  • vLLM 工具调用:Qwen2.5 支持 vLLM 内置的工具调用功能,需要 vllm>=0.6。启用此功能的命令为 vllm serve Qwen/Qwen2.5-7B-Instruct --enable-auto-tool-choice --tool-call-parser hermes,之后可像使用 GPT 的工具调用一样操作。
  • Ollama 工具调用:Qwen2.5 亦支持 Ollama 的工具调用功能,可通过启动 Ollama 的 OpenAI 兼容服务并按使用 GPT 的方式来调用工具。
  • Transformers 工具调用:Qwen2.5 的聊天模板中包含一个工具调用模板,允许用户利用 Hugging Face transformers 的工具调用支持。
工具调用模板:
  • Hermes 格式:vLLM、Ollama 和 Transformers 的工具调用支持都采用受 Nous’ Hermes 格式启发的工具调用模板。
  • 向后兼容性:尽管此前 Qwen-Agent 使用的是 Qwen2 自有的工具调用模板,Qwen2.5 仍然保持了与旧版 Qwen2 模板及 Qwen-Agent 的兼容性。

Qwen系列开源社区支持

  • Finetuning: ChatLearn, Llama-Factory, Axolotl, Firefly, Swift, XTuner, Unsloth, Liger Kernel
  • Quantization: AutoGPTQ, AutoAWQ, Neural Compressor
  • Deployment: vLLM, SGL, SkyPilot, TensorRT-LLM, OpenVino, TGI
  • API Platforms: Together, Fireworks, OpenRouter
  • Local Run: MLX, Llama.cpp, Ollama, LM Studio, Jan
  • Agent and RAG Frameworks: Dify, LlamaIndex, CrewAI
  • Evaluation: LMSys, OpenCompass, Open LLM Leaderboard
  • Model Training: Arcee AI, Sailor, Dolphin, Openbuddy

引用

  • https://github.com/QwenLM/Qwen2.5
  • https://huggingface.co/Qwen
  • 魔塔:https://modelscope.cn/organization/qwen
  • 测试:https://huggingface.co/spaces/Qwen/Qwen2.5
  • Discord:https://discord.gg/yPEP2vHTu4

关于我

欢迎关注,一起进步一起成长~

在这里插入图片描述
在这里插入图片描述

往期推荐

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值