炸裂！通义千问QwQ-32B模型开源，性能飙升，代码直接跑！

最新推荐文章于 2025-04-10 22:40:43 发布

that's boy

最新推荐文章于 2025-04-10 22:40:43 发布

阅读量911

点赞数 12

文章标签： chatgpt openai DeepSeek QwQ Qwen 通义千问人工智能

本文链接：https://blog.csdn.net/m0_66917422/article/details/146087628

版权

朋友们，AI圈又双叒叕放大招啦！这次是阿里云的通义千问团队，他们开源了一个超级厉害的大模型——QwQ-32B！这可不是闹着玩的，QwQ-32B在多个测试中表现惊艳，甚至在某些方面超越了DeepSeek-R1！是不是听起来就很心动？别急，咱们这就来一探究竟！

一、QwQ-32B：不止是“能打”！

QwQ

QwQ-32B的实力可不是吹出来的，人家可是在一系列严格的基准测试中“过五关斩六将”的！下面咱们就来细数一下它的“战绩”：

数学、编程，样样精通！
- 在AIME24（数学能力测试）和LiveCodeBench（代码能力测试）中，QwQ-32B的表现与DeepSeek-R1不相上下，远超o1-mini和同尺寸的其他模型。
- 这意味着啥？意味着QwQ-32B不仅能帮你解数学题，还能帮你写代码！是不是感觉自己的“学渣”属性和“码农”生涯都有救了？
通用能力，更上一层楼！
- 在LiveBench、IFEval和BFCL等测试中，QwQ-32B的得分甚至超过了DeepSeek-R1！
- LiveBench是啥？那可是Meta首席科学家杨立昆领衔的“最难LLMs测评榜”！
- IFEval是啥？那是谷歌等提出的指令遵循能力测试！
- BFCL是啥？那是加州大学伯克利分校等提出的评估调用函数或工具方面的测试！
- QwQ-32B能在这三大测试中脱颖而出，足以证明它在通用能力方面的强大实力！
强化学习，持续进化！
- QwQ-32B的训练过程可不简单，它在冷启动的基础上，针对数学、编程和通用能力进行了两轮大规模强化学习。
- 与其他模型不同的是，QwQ-32B在数学和编程任务的强化学习中，直接使用了“答案正确性”和“代码执行成功”作为反馈，而不是传统的奖励模型。
- 这种方法的好处是啥？那就是训练效果更直接、更有效！
- 而在通用能力的强化学习中，QwQ-32B则使用了通用奖励模型和基于规则的验证器进行训练。
- 这种“双管齐下”的训练方式，让QwQ-32B在保持数学和编程能力的同时，进一步提升了通用能力。
Agent能力，如虎添翼
- QwQ-32B 模型还集成了与智能体 Agent 相关的能力，可以在使用工具时进行批判性思考，并根据环境反馈调整推理过程。
- 这简直是如虎添翼，让模型不仅仅是生成文本，更像是一个能够思考和解决问题的“智能体”。

二、开源福利，人人可用！

这么强大的模型，是不是已经让你跃跃欲试了？别担心，QwQ-32B已经开源啦！

开源协议： Apache 2.0
开源地址：
- 魔搭社区：https://modelscope.cn/models/Qwen/QwQ-32B
- Hugging Face：https://huggingface.co/Qwen/QwQ-32B

这意味着什么？意味着你可以免费下载、使用QwQ-32B，甚至可以根据自己的需求进行修改和定制！

三、代码示例，直接开跑！

为了方便大家快速上手，通义千问团队还贴心地提供了API调用示例代码：

from openai import OpenAI
import os

# 初始化OpenAI客户端
client = OpenAI(
    # 如果环境变量未配置，请替换为您的API密钥：api_key="sk-xxx"
    # 如何获取API密钥：https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)

reasoning_content = ""
content = ""

is_answering = False

completion = client.chat.completions.create(
    model="qwq-32b",
    messages=[
        {"role": "user", "content": "9.9和9.11哪个更大？"}
    ],
    stream=True,
    # 取消注释以下行以在最后一个块中返回令牌使用情况
    # stream_options={
    #     "include_usage": True
    # }
)

print("\n" + "=" * 20 + "推理内容" + "=" * 20 + "\n")

for chunk in completion:
    # 如果chunk.choices为空，则打印使用情况
    if not chunk.choices:
        print("\nUsage:")
        print(chunk.usage)
    else:
        delta = chunk.choices[0].delta
        # 打印推理内容
        if hasattr(delta, 'reasoning_content') and delta.reasoning_content is not None:
            print(delta.reasoning_content, end='', flush=True)
            reasoning_content += delta.reasoning_content
        else:
            if delta.content != "" and is_answering is False:
                print("\n" + "=" * 20 + "内容" + "=" * 20 + "\n")
                is_answering = True
            # 打印内容
            print(delta.content, end='', flush=True)
            content += delta.content