阿里 Qwen3 开源了,这次有点猛!

嘿,听说了吗?前阵子著名 AI 科学家李飞飞所在团队(Stanford HAI)最新发布的《2025 年人工智能指数报告》里,阿里表现挺抢眼,有 6 款模型入选了「值得关注的 AI 模型」位列全球第三。这背后,是阿里多年来选择开源、技术积累的硬实力。

这不,阿里又带着他们家「通义千问」系列的新成员——Qwen3 来了! 而且一上来就霸气侧漏,表现超过了 Deepseek-R1,并给全球开源模型排行榜来了波“大换血”,向世界秀了一波中国开源大模型的实力。

GitHub 地址:github.com/QwenLM/Qwen3

那么,这位阿里开源大模型的新同学——Qwen3,到底厉害在哪儿呢?咱们一起来瞅瞅。

一、Qwen3 全家桶:从小到大,满足不同需求

阿里这次真的是掏家底了,直接来了个「Qwen3 全家桶」,一口气开源了 8 款不同尺寸的模型:

  • 常规款(Dense 模型):从 0.6B 到 32B 参数,有小到能在手机上跑的迷你版,也有能支撑企业级应用的实力派

  • 隐藏菜单(MoE 模型):更猛的 30B-A3B 和 235B-A22B。

    • 235B 的旗舰版:只需 4 张 H20 显卡就能实现本地部署,显存占用仅为性能相近模型的三分之一。

    • 30B 的平民版:性能接近之前的 Qwen2.5-32B,适用于消费级别显卡。

这么多型号,不管你是个人开发者捣鼓着玩,还是精打细算的企业用户,都能找到适合你的“菜”。

二、混合推理模型:快起来像闪电,思考起来像学霸

这次 Qwen3 全系列均为混合推理模型,原生支持两种模式:

  • 快速响应模式:遇到简单问题,“嗖”一下就能给答案,反应快,计算成本也低。

  • 深度思考模式:碰到复杂问题,它也能像个老师一样,一步步来分析推理并自我反思,给出更周全、深入的回答。

切换模式也十分方便,请求时用 /think 和 /no_think 指令随时切换。厉害的是,Qwen3 能在同一个模型里稳定地玩转这两种模式,切换时性能损失也很小。仅需部署一个模型,就能支持两种模式,真正做到“一脑双模”。

# Ollama
ollama run qwen3:30b-a3b
# SGLang
python -m sglang.launch_server --model-path Qwen/Qwen3-30B-A3B --reasoning-parser qwen3
# vLLM
vllm serve Qwen/Qwen3-30B-A3B --enable-reasoning --reasoning-parser deepseek_r1

想要禁用思考模式,也可以在启动时移除 --reasoning-parser 和 --enable-reasoning参数。

三、那性能到底怎么样?

说到成绩单 Qwen3 这次也取得了不俗的表现,最新的基准测试(Benchmark)结果:

旗舰版 Qwen3-235B-A22B,在好几个领域测试中刷新了开源模型的纪录

通过优化架构、数据和训练方法,Qwen3 Dense 基础模型显著提升了效率,可以用更小的模型规模达到与 Qwen2.5 相当的性能水平。例如,Qwen3-1.7B/4B/8B/14B/32B-Base 的表现分别与 Qwen2.5-3B/7B/14B/32B/72B-Base 相当。

四、Agent 时代?Qwen3 已经准备好了

现在的大模型,光能聊天还不行,还得会干活!这就是 Agent 时代。

Qwen3 明显是有备而来,它天生就懂怎么跟其他工具和 API 打配合,原生支持 MCP 协议、工具调用、结构化输出等能力。

这意味着,开发者可以用阿里开源的 Qwen-Agent 框架结合 Qwen3,更轻松快速地开发自己的 Agent 应用。比如,让 AI 帮你处理邮件、自动操作软件、查询信息并执行后续步骤等等,让 AI 从“能说”进化到“能做”!

GitHub 地址:github.com/QwenLM/Qwen-Agent

五、想试试?很简单,还免费!

看到这里,是不是有点心动,想上手体验下?安排!获取和使用 Qwen3 的途径不少:

  • 直接下载模型:魔搭社区(ModelScope)或 Hugging Face 就能找到。

  • 在线体验:打开通义 APP 或网站,可以直接跟 Qwen3 对话。

  • API 调用:阿里云百炼平台提供了 API 服务。

Qwen3 在线体验:chat.qwen.ai

哦对了,提一嘴:Qwen3 系列模型用的是 Apache 2.0 开源协议,可以免费商用,这点挺重要的。

六、最后我的感觉:开源大模型,阿里是认真的

从一代千问到 Qwen2.5,再到今天的 Qwen3,能看到阿里在开源大模型这条路上走的很坚决。这不仅仅是秀肌肉,更是实打实的技术积累和开源决心。

之前大佬李飞飞团队就基于 Qwen 做出了不错的成果(s1-32B),现在有了更强的 Qwen3,无疑给全球开发者提供了一个更强大的基础模型,让大家能更容易地去探索和创新。

阿里也表态了,未来计划投入 3800 亿,继续加强云计算和 AI 基础设施。意思挺明白:基础打好了,欢迎大家来上面构建应用,一起把 AI 生态做大做强。

好了,介绍得差不多了,对 Qwen3 感兴趣的话,不妨去试试看吧!

  • 在线体验:chat.qwen.ai

  • Hugging Face:huggingface.co/Qwen

  • GitHub:github.com/QwenLM/Qwen3

- END -

👆 关注「HelloGitHub」第一时间收到更新👆

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值