在 Qwen2 发布后的过去三个月里,许多开发者基于 Qwen2 语言模型构建了新的模型。9月19日阿里发布了 Qwen 家族的最新成员:
Qwen2.5
。
模型版本
最新发布包括了语言模型 Qwen2.5
,以及专门针对编程的 Qwen2.5-Coder
和数学的 Qwen2.5-Math
模型。所有开放权重的模型都是稠密的、decoder-only的语言模型,提供多种不同规模的版本,包括:
- Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及72B;
- Qwen2.5-Coder: 1.5B, 7B, 以及即将推出的32B;
- Qwen2.5-Math: 1.5B, 7B, 以及72B。
除了3B和72B的版本外,所有的开源模型都采用了 Apache 2.0 许可证。
- https://qwenlm.github.io/blog/qwen2.5-llm
- https://qwenlm.github.io/blog/qwen2.5-coder
- https://qwenlm.github.io/blog/qwen2.5-math
主要特色
Qwen2.5 语言模型更新:
- 预训练数据集:使用包含高达 18T tokens 的最新大规模数据集进行预训练。
- 知识扩展:相较于 Qwen2,Qwen2.5 在多项评估中显示出了更广泛的知识(MMLU:85+)。
- 技能提升:在编程(HumanEval 85+)、数学(MATH 80+)方面有显著进步。
- 功能增强:改善了指令执行、长文本生成(>8K 标记)、结构化数据理解和生成(如表格、JSON)的能力。
- 适应性增强:对不同类型的系统提示更加适应,提高了角色扮演和聊天机器人设定的灵活性。
- 多语言支持:支持 29 种以上的语言,包括但不限于中、英、法、西、葡、德、意、俄、日、韩等。
专业领域模型升级:
- 编程模型 Qwen2.5-Coder:在包含 5.5T tokens 的编程数据集上训练,使得小规模模型在编程评估中表现出色。
- 数学模型 Qwen2.5-Math:支持中文和英文,融合了多种推理方法,包括思考链(CoT)、思考程序(PoT)和工具集成推理(TIR)。
支持的工具
工具调用支持:
- vLLM 工具调用:Qwen2.5 支持 vLLM 内置的工具调用功能,需要 vllm>=0.6。启用此功能的命令为
vllm serve Qwen/Qwen2.5-7B-Instruct --enable-auto-tool-choice --tool-call-parser hermes
,之后可像使用 GPT 的工具调用一样操作。 - Ollama 工具调用:Qwen2.5 亦支持 Ollama 的工具调用功能,可通过启动 Ollama 的 OpenAI 兼容服务并按使用 GPT 的方式来调用工具。
- Transformers 工具调用:Qwen2.5 的聊天模板中包含一个工具调用模板,允许用户利用 Hugging Face transformers 的工具调用支持。
工具调用模板:
- Hermes 格式:vLLM、Ollama 和 Transformers 的工具调用支持都采用受 Nous’ Hermes 格式启发的工具调用模板。
- 向后兼容性:尽管此前 Qwen-Agent 使用的是 Qwen2 自有的工具调用模板,Qwen2.5 仍然保持了与旧版 Qwen2 模板及 Qwen-Agent 的兼容性。
Qwen系列开源社区支持
- Finetuning: ChatLearn,
Llama-Factory
, Axolotl, Firefly, Swift, XTuner, Unsloth, Liger Kernel - Quantization:
AutoGPTQ
,AutoAWQ
, Neural Compressor - Deployment:
vLLM
, SGL, SkyPilot, TensorRT-LLM, OpenVino, TGI - API Platforms: Together, Fireworks, OpenRouter
- Local Run: MLX, Llama.cpp,
Ollama
, LM Studio, Jan - Agent and RAG Frameworks:
Dify
,LlamaIndex
, CrewAI - Evaluation: LMSys, OpenCompass,
Open LLM Leaderboard
- Model Training: Arcee AI, Sailor, Dolphin, Openbuddy
引用
- https://github.com/QwenLM/Qwen2.5
- https://huggingface.co/Qwen
- 魔塔:https://modelscope.cn/organization/qwen
- 测试:https://huggingface.co/spaces/Qwen/Qwen2.5
- Discord:https://discord.gg/yPEP2vHTu4
关于我
欢迎关注,一起进步一起成长~