通义千问QwQ简评与使用

高通智匠MindCraft Al

于 2025-03-14 11:15:06 发布

阅读量1.3k

点赞数 6

文章标签：人工智能 ai AIGC 语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_85549225/article/details/146235718

版权

通义千问本次发布了QwQ-32B和QwQ-Plus两个推理模型。

QwQ-32B开源模型

我们先来看QwQ-32B，这是一个开源的推理模型，以32B的参数，在部分指标达到Deepseek R1 671B（激活参数37B）的效果。

在图表中，QwQ-32B主要对标了几个Deepseek R1的模型，我们可以看到在图中的几个指标，与Deepseek R1满血版几乎相当。这几个指标的具体作用

AIME24：数学推理；

LiveCodeBench：代码编程能力；

LiveBench：综合能力评测，包含推理、数据分析、数学、编程、语言理解和指令执行。

IFEval：InstructionFollowEvaluation，指令遵循评估；

BFCL：Berkley Function Calling Leaderboard，伯克利函数调用排行榜；

所以，我们看到这个模型主要体现了在数学能力，编程能力，以及Agent能力方面，达到很高的水平。虽然不是所有能力都比满血deepseek r1强，但推理模型本身擅长也就是理工科问题。

在保持高水准的同时，模型参数缩小到32B意味着什么？

成本降低。API调用费用输入2元/百万tokens，输出6元/百万tokens。相比deepseek r1，输入4元/百万tokens，输出16元/百万tokens，价格低了一倍不止。
私人部署的可行性进一步提高。Deepseek R1火爆全网的时候，大家都在研究怎么本地部署，然而满血版Deepseek R1部署门槛太高了，而32B版本虽然可以用高端电脑部署，但是模型效果又不好。如今QwQ-32B部署门槛大幅降低，同时能达到Deepseek R1的效果，这就意味着对于很多企业私有化部署的场景，可行性大增。只要万把块就能玩私有化部署，这或许是一个行业拐点。

QwQ-Plus：极具性价比的商业推理模型

那讲完QwQ-32B，我们再来说说QwQ-Plus。这个版本，没有太详细的资料，但是我们在官网上可以看到，QwQ-Plus是增强版的推理模型，那应该比QwQ-32B更强，但是它的价格反而更便宜，输入价格1.6元/百万tokens，输出价格4元/百万tokens，输出成本只有Deepseek R1满血版的四分之一，上下文有128K。那这是怎么回事呢？据官方人员介绍，这个QwQ-Plus是商业化版本，QwQ-32B是开源版本，所以商业化版本会更有竞争力，后续主要迭代也是在这个型号上。所以大家如果要做API方面的商业使用，就用这个QwQ-Plus。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。