大家好,欢迎来到程序视点
!我是你们的老朋友.小二!
2025年4月29日,阿里巴巴集团发布开源大语言模型家族最新成员Qwen3
,为AI创新树立新标杆。
Qwen3系列简介
Qwen3系列包含六款密集模型与两款混合专家模型(Mixture-of-Experts, MoE)
,有助开发者更灵活地开发适用于移动设备、智能眼镜、自动驾驶汽车及机器人等场景上的应用。
Qwen3全系列模型现已开源并全球上线,包含六款密集模型(参数量0.6B、1.7B、4B、8B、14B、32B)及两款MoE模型(30B总参数、3B激活参数;235B总参数、22B激活参数)。
Qwen3 开源模型核心亮点
-
模型能力全球领先
-
Qwen3 系列模型性能登顶全球,旗舰版 Qwen3-235B-A22B 对标顶级闭源模型,部分指标超越 Gemini 2.5 Pro。
-
小尺寸模型(如 Qwen3-4B)性能接近上一代 Qwen-32B,MoE 模型 Qwen3-30B-A3B 全面超越 Qwen-32B。
-
-
首个开源混合推理模型
-
支持 普通模式(无思维链)和 推理模式(长思考),无需切换模型,开发者体验更优。
-
类似 DeepSeek V3(普通模式)和 R1(推理模式)的结合,但集成于单一模型。
-
-
8 个不同尺寸模型,覆盖全场景
-
Qwen3-30B-A3B(总参数量 30B,激活 3B)
-
Qwen3-235B-A22B(总参数量 235B,激活 22B,部署成本仅 DeepSeek R1 的 1/3)。
-
稠密模型(Dense):0.6B、1.7B、4B、8B、14B、32B,适用于不同算力需求。
-
MoE 模型:
-
Token 支持:0.6B~4B 支持 32K,其余支持 128K。
-
-
低成本、高效部署
-
旗舰模型 Qwen3-235B-A22B 推理成本极低,适合企业级应用。
-
-
支持 MCP 协议 & 增强 Agent 能力
- 提升任务规划与执行能力,支持多模态协作(如调用即梦 AI 画图)。
-
多语言支持大幅提升
- 支持 **119 种语言**(上一代仅 29 种),覆盖更广泛的全球用户需求。
其他
-
开源协议:Apache 2.0,可自由商用。
-
Blog: https://qwenlm.github.io/blog/qwen3/
GitHub: https://github.com/QwenLM/Qwen3
图片
-
体验方式:
-
官方 Demo:Qwen Chat(默认旗舰版)
-
通义千问:Tongyi
-
-
实测表现:
-
代码生成:能生成完整的前端页面(如登录页、交互式时间线)。
-
游戏开发:可完成简单游戏(如连连看),复杂项目(如弹球游戏)略有瑕疵。
-
多模态扩展:支持与即梦 AI 结合,实现图文混排效果。
-
总结
Qwen3 以 高性能、低成本、全场景覆盖 为核心优势,通过混合推理、MoE 架构和多语言支持,成为当前最具竞争力的开源大模型之一。阿里此次开源诚意十足,技术突破显著,为开发者与用户提供了更灵活、高效的选择。
最后
【程序视点】助力打工人减负,从来不是说说而已!后续小二哥会继续详细分享更多实用的工具和功能。
如果这篇文章对你有帮助的话,别忘了【在看】【点赞】支持下哦~