通义千问QwQ简评与使用

通义千问本次发布了QwQ-32B和QwQ-Plus两个推理模型。

  •  QwQ-32B开源模型

我们先来看QwQ-32B,这是一个开源的推理模型,以32B的参数,在部分指标达到Deepseek R1 671B(激活参数37B)的效果。

在图表中,QwQ-32B主要对标了几个Deepseek R1的模型,我们可以看到在图中的几个指标,与Deepseek R1满血版几乎相当。这几个指标的具体作用

AIME24:数学推理;

LiveCodeBench:代码编程能力;

LiveBench:综合能力评测,包含推理、数据分析、数学、编程、语言理解和指令执行。

IFEval:InstructionFollowEvaluation,指令遵循评估;

BFCL:Berkley Function Calling Leaderboard,伯克利函数调用排行榜;

所以,我们看到这个模型主要体现了在数学能力,编程能力,以及Agent能力方面,达到很高的水平。虽然不是所有能力都比满血deepseek r1强,但推理模型本身擅长也就是理工科问题。

在保持高水准的同时,模型参数缩小到32B意味着什么?

  1.  成本降低。API调用费用输入2元/百万tokens,输出6元/百万tokens。相比deepseek r1,输入4元/百万tokens,输出16元/百万tokens,价格低了一倍不止。
  2.  私人部署的可行性进一步提高。Deepseek R1火爆全网的时候,大家都在研究怎么本地部署,然而满血版Deepseek R1部署门槛太高了,而32B版本虽然可以用高端电脑部署,但是模型效果又不好。如今QwQ-32B部署门槛大幅降低,同时能达到Deepseek R1的效果,这就意味着对于很多企业私有化部署的场景,可行性大增。只要万把块就能玩私有化部署,这或许是一个行业拐点。
  •  QwQ-Plus:极具性价比的商业推理模型

那讲完QwQ-32B,我们再来说说QwQ-Plus。这个版本,没有太详细的资料,但是我们在官网上可以看到,QwQ-Plus是增强版的推理模型,那应该比QwQ-32B更强,但是它的价格反而更便宜,输入价格1.6元/百万tokens,输出价格4元/百万tokens,输出成本只有Deepseek R1满血版的四分之一,上下文有128K。那这是怎么回事呢?据官方人员介绍,这个QwQ-Plus是商业化版本,QwQ-32B是开源版本,所以商业化版本会更有竞争力,后续主要迭代也是在这个型号上。所以大家如果要做API方面的商业使用,就用这个QwQ-Plus。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值