模型效果
QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力。下图展示了 QwQ-32B 与其他模型的性能对比,包括 DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B、o1-mini 以及原始的 DeepSeek-R1。
在多项评测中,QwQ-32B 表现惊人:
-
数学推理(AIME24):与 DeepSeek-R1 持平,远超同尺寸蒸馏模型。
-
代码能力(LiveCodeBench):接近 DeepSeek-R1,碾压 OpenAI o1-mini。
-
通用能力(LiveBench、IFEval、BFCL):得分全面超越 DeepSeek-R1,尤其在指令遵循和工具调用上优势显著。
-
成本效益:以 0.25 美元/Token 的成本,实现 70 分以上的 LiveBench 评分,性价比远超 DeepSeek-R1(2.5 美元/Token)。
未来展望
QwQ-32B 的诞生只是通义千问团队“三步走” AGI 战略的起点,未来会深化强化学习与基础模型的融合,通过万亿级参数+RL 训练框架解锁模型潜能,构建可调用工具、感知环境、动态规划的长时推理智能体,实现“AI 自主决策”,让推理时间扩展成为智能跃迁的新杠杆。这场由 DeepSeek 开启、阿里接力的中国 AI 创新浪潮正在改写规则:当西方巨头沉迷“暴力堆参数”时,中国团队以“精巧设计+系统工程”开辟新赛道。正如 QwQ-32B 所证明的——通向 AGI 的钥匙,或许就藏在“小模型的大智慧”中。此刻体验 Qwen Chat,您已站在下一代 AI 的起跑线上!
免费调试 QwQ-32B 接口
步骤 1:注册阿里云账号(超简单)
访问阿里云官网( https://www.aliyun.com ),注册并登录账号。
搜索并找到「大模型服务平台百炼」,点进去。
依次点击「免费体验 → 同意服务协议 → 免费领取额度」。
100 万 Tokens 到手! 我当时看到这个数字的表情就是:😲
你可以在阿里云百炼的「模型广场」查看免费额度。如果领取时提示未实名,别慌!在阿里云主页右上角点击「账号中心」,进入「实名认证」页面,按引导完成个人认证就行。
步骤 2:生成你的 API Key(你的 AI 通行证)
在阿里云百炼后台,点击页面右上角的「头像 -> API-KEY」。
在新页面中创建你的 API Key,并复制下来。
这个 API Key 就是你的"AI 通行证",后续调用 DeepSeek-R1、通义千问等模型全靠它!我第一次拿到这个 Key 的感觉,就像拿到了数字世界的万能钥匙...
为了方便体验 DeepSeek-R1,我用 HiFox 来操作,只需填入 API Key,就能流畅对话, 简直不要太爽 !
步骤 3:Apifox 在线调试 API
获取了 API Key 可以在 API 平台调用 QwQ-32B 以进行调试。
Apifox 为便于开发者调试主流的 AI 模型,已经搭建好现成「通义千问 API 文档」,在线即可调试 QwQ-32B 接口。
如果你还没有用过 Apifox,强烈推荐去使用,它是一个集成了 API 文档、API 调试、API 设计、API 测试、API Mock、自动化测试的 API 一体化协作平台。
进入项目,然后在项目右上角的 “环境管理” 中,点击“正式环境”,阿里通义千问的 API Key,添加完成后保存即可。
将页面右上角的环境管理中的环境切换到 “正式环境”,然后选择调试接口,点击 “发送” 按钮发送请求。
阿里福利调试 QwQ-32B 目前是免费体验的。
在阿里百炼,注册后每个模型都有 100 万tokens。超过 30+ AI 模型,涵盖了国内外主流 AI 大模型,开发者的圣地!
还等什么,赶紧体验阿里「QwQ-32B+Apifox」!