朋友们,AI圈又双叒叕放大招啦!这次是阿里云的通义千问团队,他们开源了一个超级厉害的大模型——QwQ-32B!这可不是闹着玩的,QwQ-32B在多个测试中表现惊艳,甚至在某些方面超越了DeepSeek-R1!是不是听起来就很心动?别急,咱们这就来一探究竟!
一、QwQ-32B:不止是“能打”!
QwQ-32B的实力可不是吹出来的,人家可是在一系列严格的基准测试中“过五关斩六将”的!下面咱们就来细数一下它的“战绩”:
-
数学、编程,样样精通!
- 在AIME24(数学能力测试)和LiveCodeBench(代码能力测试)中,QwQ-32B的表现与DeepSeek-R1不相上下,远超o1-mini和同尺寸的其他模型。
- 这意味着啥?意味着QwQ-32B不仅能帮你解数学题,还能帮你写代码!是不是感觉自己的“学渣”属性和“码农”生涯都有救了?
-
通用能力,更上一层楼!
- 在LiveBench、IFEval和BFCL等测试中,QwQ-32B的得分甚至超过了DeepSeek-R1!
- LiveBench是啥?那可是Meta首席科学家杨立昆领衔的“最难LLMs测评榜”!
- IFEval是啥?那是谷歌等提出的指令遵循能力测试!
- BFCL是啥?那是加州大学伯克利分校等提出的评估调用函数或工具方面的测试!
- QwQ-32B能在这三大测试中脱颖而出,足以证明它在通用能力方面的强大实力!
-
强化学习,持续进化!
- QwQ-32B的训练过程可不简单,它在冷启动的基础上,针对数学、编程和通用能力进行了两轮大规模强化学习。
- 与其他模型不同的是,QwQ-32B在数学和编程任务的强化学习中,直接使用了“答案正确性”和“代码执行成功”作为反馈,而不是传统的奖励模型。
- 这种方法的好处是啥?那就是训练效果更直接、更有效!
- 而在通用能力的强化学习中,QwQ-32B则使用了通用奖励模型和基于规则的验证器进行训练。
- 这种“双管齐下”的训练方式,让QwQ-32B在保持数学和编程能力的同时,进一步提升了通用能力。
-
Agent能力,如虎添翼
- QwQ-32B 模型还集成了与智能体 Agent 相关的能力,可以在使用工具时进行批判性思考,并根据环境反馈调整推理过程。
- 这简直是如虎添翼,让模型不仅仅是生成文本,更像是一个能够思考和解决问题的“智能体”。
二、开源福利,人人可用!
这么强大的模型,是不是已经让你跃跃欲试了?别担心,QwQ-32B已经开源啦!
- 开源协议: Apache 2.0
- 开源地址:
这意味着什么?意味着你可以免费下载、使用QwQ-32B,甚至可以根据自己的需求进行修改和定制!
三、代码示例,直接开跑!
为了方便大家快速上手,通义千问团队还贴心地提供了API调用示例代码:
from openai import OpenAI
import os
# 初始化OpenAI客户端
client = OpenAI(
# 如果环境变量未配置,请替换为您的API密钥:api_key="sk-xxx"
# 如何获取API密钥:https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)
reasoning_content = ""
content = ""
is_answering = False
completion = client.chat.completions.create(
model="qwq-32b",
messages=[
{"role": "user", "content": "9.9和9.11哪个更大?"}
],
stream=True,
# 取消注释以下行以在最后一个块中返回令牌使用情况
# stream_options={
# "include_usage": True
# }
)
print("\n" + "=" * 20 + "推理内容" + "=" * 20 + "\n")
for chunk in completion:
# 如果chunk.choices为空,则打印使用情况
if not chunk.choices:
print("\nUsage:")
print(chunk.usage)
else:
delta = chunk.choices[0].delta
# 打印推理内容
if hasattr(delta, 'reasoning_content') and delta.reasoning_content is not None:
print(delta.reasoning_content, end='', flush=True)
reasoning_content += delta.reasoning_content
else:
if delta.content != "" and is_answering is False:
print("\n" + "=" * 20 + "内容" + "=" * 20 + "\n")
is_answering = True
# 打印内容
print(delta.content, end='', flush=True)
content += delta.content
这段代码可以直接复制粘贴到你的Python环境中运行,是不是超级方便?
四、结语
QwQ-32B的开源,无疑为AI社区注入了一剂强心针。它不仅展示了通义千问团队在技术上的深厚积累,也为广大的AI开发者和爱好者提供了一个强大的工具。如果你也对AI感兴趣,不妨下载QwQ-32B体验一下,相信它会给你带来惊喜!
还在到处找AI工具?ChatTools 已为你备好!GPT-4o、Claude 3、Gemini、Midjourney等热门模型,一键畅玩!