阿里 Qwen3 开源了，这次有点猛！

最新推荐文章于 2025-04-30 20:34:32 发布

削微寒

最新推荐文章于 2025-04-30 20:34:32 发布

阅读量808

点赞数 8

本文链接：https://blog.csdn.net/a419240016/article/details/147793405

版权

嘿，听说了吗？前阵子著名 AI 科学家李飞飞所在团队（Stanford HAI）最新发布的《2025 年人工智能指数报告》里，阿里表现挺抢眼，有 6 款模型入选了「值得关注的 AI 模型」位列全球第三。这背后，是阿里多年来选择开源、技术积累的硬实力。

这不，阿里又带着他们家「通义千问」系列的新成员——Qwen3 来了！ 而且一上来就霸气侧漏，表现超过了 Deepseek-R1，并给全球开源模型排行榜来了波“大换血”，向世界秀了一波中国开源大模型的实力。

GitHub 地址：github.com/QwenLM/Qwen3

那么，这位阿里开源大模型的新同学——Qwen3，到底厉害在哪儿呢？咱们一起来瞅瞅。

一、Qwen3 全家桶：从小到大，满足不同需求

阿里这次真的是掏家底了，直接来了个「Qwen3 全家桶」，一口气开源了 8 款不同尺寸的模型：

常规款（Dense 模型）：从 0.6B 到 32B 参数，有小到能在手机上跑的迷你版，也有能支撑企业级应用的实力派。
隐藏菜单（MoE 模型）：更猛的 30B-A3B 和 235B-A22B。
- 235B 的旗舰版：只需 4 张 H20 显卡就能实现本地部署，显存占用仅为性能相近模型的三分之一。
- 30B 的平民版：性能接近之前的 Qwen2.5-32B，适用于消费级别显卡。

这么多型号，不管你是个人开发者捣鼓着玩，还是精打细算的企业用户，都能找到适合你的“菜”。

二、混合推理模型：快起来像闪电，思考起来像学霸

这次 Qwen3 全系列均为混合推理模型，原生支持两种模式：

快速响应模式：遇到简单问题，“嗖”一下就能给答案，反应快，计算成本也低。
深度思考模式：碰到复杂问题，它也能像个老师一样，一步步来分析推理并自我反思，给出更周全、深入的回答。

切换模式也十分方便，请求时用 /think 和 /no_think 指令随时切换。厉害的是，Qwen3 能在同一个模型里稳定地玩转这两种模式，切换时性能损失也很小。仅需部署一个模型，就能支持两种模式，真正做到“一脑双模”。

# Ollama
ollama run qwen3:30b-a3b
# SGLang
python -m sglang.launch_server --model-path Qwen/Qwen3-30B-A3B --reasoning-parser qwen3
# vLLM
vllm serve Qwen/Qwen3-30B-A3B --enable-reasoning --reasoning-parser deepseek_r1

想要禁用思考模式，也可以在启动时移除 --reasoning-parser 和 --enable-reasoning参数。