牛！比肩DeepSeek-R1！阿里发布Qwen3全系列！6款模型齐出，势不可挡！

程序视点

于 2025-04-30 10:45:12 发布

阅读量352

点赞数 6

分类专栏：编程经验 AIGC 工具文章标签： Qwen3 Qwen 千问 MCP AIGC AI

本文链接：https://blog.csdn.net/weixin_49562392/article/details/147626718

版权

编程经验同时被 3 个专栏收录

34 篇文章

订阅专栏

工具

28 篇文章

订阅专栏

AIGC

8 篇文章

订阅专栏

大家好，欢迎来到程序视点！我是你们的老朋友.小二！

2025年4月29日，阿里巴巴集团发布开源大语言模型家族最新成员Qwen3，为AI创新树立新标杆。

Qwen3系列简介

Qwen3系列包含六款密集模型与两款混合专家模型（Mixture-of-Experts, MoE），有助开发者更灵活地开发适用于移动设备、智能眼镜、自动驾驶汽车及机器人等场景上的应用。

Qwen3全系列模型现已开源并全球上线，包含六款密集模型（参数量0.6B、1.7B、4B、8B、14B、32B）及两款MoE模型（30B总参数、3B激活参数；235B总参数、22B激活参数）。

Qwen3 开源模型核心亮点

模型能力全球领先
- Qwen3 系列模型性能登顶全球，旗舰版 Qwen3-235B-A22B 对标顶级闭源模型，部分指标超越 Gemini 2.5 Pro。
- 小尺寸模型（如 Qwen3-4B）性能接近上一代 Qwen-32B，MoE 模型 Qwen3-30B-A3B 全面超越 Qwen-32B。
首个开源混合推理模型
- 支持 普通模式（无思维链）和 推理模式（长思考），无需切换模型，开发者体验更优。
- 类似 DeepSeek V3（普通模式）和 R1（推理模式）的结合，但集成于单一模型。
8 个不同尺寸模型，覆盖全场景
- Qwen3-30B-A3B（总参数量 30B，激活 3B）
- Qwen3-235B-A22B（总参数量 235B，激活 22B，部署成本仅 DeepSeek R1 的 1/3）。
- 稠密模型（Dense）：0.6B、1.7B、4B、8B、14B、32B，适用于不同算力需求。
- MoE 模型：
- Token 支持：0.6B~4B 支持 32K，其余支持 128K。
低成本、高效部署
- 旗舰模型 Qwen3-235B-A22B 推理成本极低，适合企业级应用。
支持 MCP 协议 & 增强 Agent 能力

- 提升任务规划与执行能力，支持多模态协作（如调用即梦 AI 画图）。

多语言支持大幅提升

- 支持 **119 种语言**（上一代仅 29 种），覆盖更广泛的全球用户需求。![图片](https://mmbiz.qpic.cn/mmbiz_png/OjgKEXmLURrgmcHYkNoia5nWWl1FCD5YRO97pE5OmA4ryd1RETSDAg7XEVdDEKMTzp4LicwDibYNR1qM9ibYp1OIIQ/640?wx_fmt=png&from=appmsg&tp=wxpic&wxfrom=5&wx_lazy=1)

其他

开源协议：Apache 2.0，可自由商用。
Blog: https://qwenlm.github.io/blog/qwen3/

GitHub: https://github.com/QwenLM/Qwen3

图片
体验方式：
- 官方 Demo：Qwen Chat（默认旗舰版）
- 通义千问：Tongyi
实测表现：
- 代码生成：能生成完整的前端页面（如登录页、交互式时间线）。
- 游戏开发：可完成简单游戏（如连连看），复杂项目（如弹球游戏）略有瑕疵。
- 多模态扩展：支持与即梦 AI 结合，实现图文混排效果。