牛!比肩DeepSeek-R1!阿里发布Qwen3全系列!6款模型齐出,势不可挡!

大家好,欢迎来到程序视点!我是你们的老朋友.小二!

2025年4月29日,阿里巴巴集团发布开源大语言模型家族最新成员Qwen3,为AI创新树立新标杆。

Qwen3系列简介

Qwen3系列包含六款密集模型与两款混合专家模型(Mixture-of-Experts, MoE),有助开发者更灵活地开发适用于移动设备、智能眼镜、自动驾驶汽车及机器人等场景上的应用。

e30caa90046c7c64e48c24a92719b1f2.jpg

Qwen3全系列模型现已开源并全球上线,包含六款密集模型(参数量0.6B、1.7B、4B、8B、14B、32B)及两款MoE模型(30B总参数、3B激活参数;235B总参数、22B激活参数)。

Qwen3 开源模型核心亮点

  1. 模型能力全球领先

    • Qwen3 系列模型性能登顶全球,旗舰版 Qwen3-235B-A22B 对标顶级闭源模型,部分指标超越 Gemini 2.5 Pro。

    • 小尺寸模型(如 Qwen3-4B)性能接近上一代 Qwen-32B,MoE 模型 Qwen3-30B-A3B 全面超越 Qwen-32B。

  2. 首个开源混合推理模型

    • 支持 普通模式(无思维链)和 推理模式(长思考),无需切换模型,开发者体验更优。

    • 类似 DeepSeek V3(普通模式)和 R1(推理模式)的结合,但集成于单一模型。

  3. 8 个不同尺寸模型,覆盖全场景

    • Qwen3-30B-A3B(总参数量 30B,激活 3B)

    • Qwen3-235B-A22B(总参数量 235B,激活 22B,部署成本仅 DeepSeek R1 的 1/3)。

    • 稠密模型(Dense):0.6B、1.7B、4B、8B、14B、32B,适用于不同算力需求。

    • MoE 模型

    • Token 支持:0.6B~4B 支持 32K,其余支持 128K。

  4. 低成本、高效部署

    • 旗舰模型 Qwen3-235B-A22B 推理成本极低,适合企业级应用。

  5. 支持 MCP 协议 & 增强 Agent 能力

- 提升任务规划与执行能力,支持多模态协作(如调用即梦 AI 画图)。
  1. 多语言支持大幅提升

- 支持 **119 种语言**(上一代仅 29 种),覆盖更广泛的全球用户需求。![图片](https://mmbiz.qpic.cn/mmbiz_png/OjgKEXmLURrgmcHYkNoia5nWWl1FCD5YRO97pE5OmA4ryd1RETSDAg7XEVdDEKMTzp4LicwDibYNR1qM9ibYp1OIIQ/640?wx_fmt=png&from=appmsg&tp=wxpic&wxfrom=5&wx_lazy=1)

其他

  • 开源协议:Apache 2.0,可自由商用。

  • Blog: https://qwenlm.github.io/blog/qwen3/

    GitHub: https://github.com/QwenLM/Qwen3

    图片

    图片

  • 体验方式

    • 官方 Demo:Qwen Chat(默认旗舰版)

    • 通义千问:Tongyi

  • 实测表现

    • 代码生成:能生成完整的前端页面(如登录页、交互式时间线)。

    • 游戏开发:可完成简单游戏(如连连看),复杂项目(如弹球游戏)略有瑕疵。

    • 多模态扩展:支持与即梦 AI 结合,实现图文混排效果。

总结

Qwen3 以 高性能、低成本、全场景覆盖 为核心优势,通过混合推理、MoE 架构和多语言支持,成为当前最具竞争力的开源大模型之一。阿里此次开源诚意十足,技术突破显著,为开发者与用户提供了更灵活、高效的选择。

最后

【程序视点】助力打工人减负,从来不是说说而已!后续小二哥会继续详细分享更多实用的工具和功能。

如果这篇文章对你有帮助的话,别忘了【在看】【点赞】支持下哦~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值