DeepSider插件正式接入阿里QwQ-32B模型

最新推荐文章于 2025-04-07 10:41:11 发布

Constantine37

最新推荐文章于 2025-04-07 10:41:11 发布

阅读量717

点赞数 8

文章标签：人工智能

本文链接：https://blog.csdn.net/Constantine37/article/details/146074618

版权

阿里新出的AI"小钢炮"——325亿参数的QwQ-32B凭啥吊打行业顶流DeepSeek？

今天凌晨，阿里最新开源QwQ-32B模型，别看它参数只有325亿（相当于普通手机内存大小），但性能直接对标行业顶流DeepSeek-R1（6710亿参数）。

性能强劲

QwQ-32B在数学推理、代码生成等核心能力上，直接对标6710亿参数的DeepSeek-R1满血版。

这种“小身材、高能力”的特性，得益于两阶段强化学习训练：先通过冷启动数据建立基础推理逻辑，再针对数学/编程/通用任务进行动态优化，最终实现多步问题解决能力的跃升。

成本碾压

显存需求从行业顶流的1400G直接砍到120G，普通消费级显卡（如RTX 4090）就能跑
部署成本仅为同类模型的1/20，企业不用砸钱买专业设备。

普通用户如何使用QwQ-32B？

若想随时随地与QwQ-32B交互，推荐安装DeepSider浏览器插件。

DeepSider支持在网页侧边栏直接开启对话界面，无需切换应用即可调用模型能力——无论是调试代码、解答数学题，还是生成创意文案，都能通过浏览器实现无缝衔接。

此外，DeepSider还支持DeepSeek-R1满血版模型，以及DeepSeek-V3，刚好可以与QwQ-32B进行对比测试。

DeepSider插件安装方法

Chrome：访问Chrome Web Store搜索“DeepSider”，点击“添加”

Edge：因商店版本更新较慢，建议在deepsider.ai网站下载离线版安装文件，拖拽到浏览器扩展管理页，完成安装

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Constantine37

关注关注

8
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

阿里云 QwQ-32B 模型调研文档

agito_cheung的博客

03-09

522

QwQ-32B 是阿里云开源的轻量化大语言模型，以320 亿参数实现与 DeepSeek-R1（6710 亿参数）相当的推理性能。参数效率：1/20 参数量达成竞品性能，显存需求降低 70%部署灵活性：支持消费级硬件（如双 RTX 4090 或 Mac 设备）本地运行开源生态：可通过 Ollama 等工具快速部署，适配企业与个人开发者场景。

阿里通义千问QwQ-32B：小参数大能量，重新定义推理模型新范式

xiezhipu的博客

03-06

667

在人工智能领域，模型参数规模与性能的正相关关系曾被视为行业铁律。然而，阿里巴巴通义千问团队于2025年3月6日发布的QwQ-32B模型，以320亿参数规模实现了与6710亿参数模型DeepSeek-R1（370亿激活参数）相媲美的推理能力，彻底打破了这一固有认知。这款通过大规模强化学习（RL）技术优化的模型，不仅在数学推理、代码生成等专业领域表现卓越，更在通用能力评测中实现了多项超越，标志着AI技术从"大力出奇迹"向"精巧出智慧"的重要转折。

参与评论您还未登录，请先登录后发表或查看评论

DeepSider，一款免费DeepSeek满血稳定版浏览器插件

Constantine37的博客

03-04

3884

DeepSider是一款集成于浏览器侧边栏的免费AI对话工具，基于DeepSeek R1和DeepSeek V3模型满血版开发。

DeepSider，可免费白嫖gpt4的浏览器插件

Constantine37的博客

03-17

602

deepsider目前可免费使用gpt4对话

我自己开发的浏览器插件DeepSider用户破万了！

Constantine37的博客

03-11

498

免费提供DeepSeek R1满血版和阿里QwQ 32B对话功能

单显卡即可！深度解析QWQ-32B开源模型本地化部署

h1453586413的博客

03-08

4929

AI大模型企业应用实战：Prompt让LLM理解知识

2401_84204413的博客

06-25

2552

单卡RTX 4090轻松部署Qwen QwQ-32B-AWQ！详细教程+性能实测

scwang18的博客

03-09

2303

🌟🌟听说用大模型做复杂任务很吃硬件？但今天我们要告诉你——不信？看完这篇教程，带你从环境配置到部署测试，分分钟体验320亿参数大模型的威力！

保姆级教程：阿里QwQ-32B模型本地部署与企业级应用实战（附万字指南+工具链）

weixin_42358373的博客

03-07

1124

验证API（curl http://localhost:8000）克隆仓库（git clone https://...）安装依赖（CUDA 12.1 + cuDNN）启动服务（python server.py）数据来源：阿里开源文档[[4]][[6]]下载模型权重（ModelScope）

QwQ-32B-GGUF模型部署

NDF923的专栏

04-01

1068

由于硬件只有两张4090卡，但是领导还想要满血版32b的性能，那就只能部署GGUF版。据说QwQ-32B比Deepseek-R1-32b要更牛逼一些，所以就选择部署QwQ-32B-GGUF，根据最终的测试--针对长文本（3-5M大小）的理解，QwQ-32B-GGUF确实要比Deepseek-R1-32b-GGUF好一些。是阿里官方发布的原始模型，通常以 PyTorch 权重文件（如.bin或）形式存储，需依赖深度学习框架（如 Hugging Face Transformers）加载。

weixin_42358373的博客

03-07

2113

推荐一款浏览器插件，能免费用Grok3等顶级大模型

Constantine37的博客

03-20

284

DeepSider集成在浏览器侧边栏中，最开始，它主打的是DeepSeek R1满血版模型，解决官网服务器繁忙的问题。实时问答、内容创作、翻译和代码生成，都可以直接在浏览器的侧边栏里解决，同时还不影响正常浏览网页。安装完成后，记得点击后面的固定按钮，把DeepSider固定在浏览器工具栏上。想使用AI对话的时候，点击工具栏里的DeepSider图标，就可以进行对话了。本来以为海外大模型的中文能力一般，没想到试了一下，写出来的小说很惊艳。尤其是Grok 3，好用是好用，就是太贵了，网上找代充都要100多块。

DeepSeekR1 劲敌出现了，QwQ32B本地部署测试，RTX3060成功运行！

m0_65555479的博客

03-07

2498

不花钱也能玩GPT-4o，国内可用

最新发布

CCEEHM的博客

04-07

1032

DeepSider是这款浏览器插件，集成GPT-4o、Claude 3.7、Gemini 2.0、Deepseek R1等20+主流大模型，无需魔法和API密钥即可免费使用，每日提供12次绘画次数。你可以选择直接选择谷歌邮箱账号登录，也可以注册账号，支持国内邮箱，登录进入后，点击模型，下拉到最底下，选择底部GPT-4o-image画图。支持各种图像风格生成，老照片修复、海报一键生成、电商图融合生成、设计稿生成等等，你能想到的各种图像生成场景，都能实现，小伙伴们赶紧去试试吧！本期的AI信息差分享，就到这啦！

QwQ模型介绍与性能实测！1/10硬件成本，性能比肩DeepSeek R1模型

fufan_LLM的博客

03-06

2041

而现在，时隔3个月，QWQ模型再度回归，和此前Preview模型不同，现在的QWQ-32B正式版模型能力暴涨，在数学、编程等推理领域的能力甚至和671B的DeepSeek R1模型相当，并在强化学习的后训练阶段，原创性的提出了多段强化学习训练法，并在每个RL训练阶段，单独专注于提升模型的某一个方面的能力，如第一个阶段训练模型代码能力、第二个阶段训练模型编程能力等。QWQ系列模型，是阿里千问模型中的推理类大模型，早在去年12月就发布了QWQ-32B-Preview预览模型，也是当时业内最早开源的推理大模型。

Sider：一款集AI助手、侧边栏工具与生产力增强于一体的超级工具箱

2403_86762465的博客

02-10

1251

Sider 是一款基于人工智能的综合工具，旨在增强用户的在线生产力，并提供便捷的AI助手服务。它以浏览器扩展的形式存在，将 AI 的强大功能集成到用户的日常工作流程中，无需在不同的应用程序之间切换。Sider 是一款功能强大的 AI 工具，它将 AI 的强大功能集成到用户的日常工作流程中，帮助用户更高效地完成任务、获取信息和创造内容。Sider 最突出的特点是其集成的侧边栏。它通常支持多个领先的 AI 模型，例如 GPT-3.5、GPT-4、Claude 等，用户可以根据任务的性质选择最合适的模型。

我花了5分钟，成功部署阿里QwQ-32B，秒出的感觉太爽了

h1453586413的博客

03-08

3983

Manus 昨天平地一声雷炸的圈子里的好多人都头脑发热了，官方和一些带节奏的人估计都度过了难忘的一天。今天圈子终于开始有点回归理性了。今天除了五位数的邀请码一码难求，另一边复现 Manus 项目出的飞快，连卖 Manus 的课教程都冒出来了，真快啊（不过大家还是要谨慎一点擦亮眼睛）。回到今天群聊的榜一大哥——QwQ 32B.我翻了一下聊天记录，吐槽最多的是——推题 token 太长，动辄 2、3 万字一直在推理，不出东西其实 QwQ 这个模型之前发布过一个预览版，只不过这次是正式版。

低成本抗衡DeepSeek-R1！阿里重磅开源QwQ-32B，推理模型的“降维打击”来了！

SJJS_1的博客

03-06

834

3月6日，阿里宣布开源推理模型 QwQ-32B，320亿参数却实现了与 DeepSeek-R1 满血版相匹敌的性能，甚至在多项测试中实现了超越。这一突破打破了“参数规模决定性能”的固有认知，将推理能力提升至新的高度。

qwq-32b模型结构

03-10

### QwQ-32B 模型架构解析大型语言模型如QwQ-32B通常基于Transformer架构构建，这是一种广泛应用于自然语言处理任务中的神经网络框架[^1]。该类模型通过多层自注意力机制来捕捉输入序列内部的关系，从而实现高效的信息传递。 #### 主要组件构成 1. **编码器（Encoder）** 编码器负责接收原始文本数据并将其转换成向量表示形式。每一层都包含了多个子模块，其中包括一个多头自注意单元以及一个全连接前馈网络。这种设计使得模型能够在不同位置之间建立联系的同时保持计算效率。 2. **解码器（Decoder）** 解码器用于生成目标序列，在机器翻译等应用中尤为关键。类似于编码部分，这里也采用了类似的分层结构；不过额外引入了一个交叉关注机制，允许解码过程利用来自源端的信息指导输出。 3. **嵌入层（Embedding Layer）** 输入词被映射到连续空间内的稠密向量，此操作由嵌入矩阵完成。对于像QwQ这样的预训练模型而言，初始权重往往已经过大规模语料库上的无监督学习获得优化。 4. **位置编码（Positional Encoding）** Transformer并不具备内置的时间/顺序感知能力，因此需要显式加入关于词语相对或绝对位置的信息。这通常是借助正弦波函数或者可训练参数表征的位置特征实现。 5. **规范化与激活函数** 各种类型的标准化方法（Layer Normalization）、非线性变换（ReLU/GELU等），有助于稳定梯度流动、加速收敛速度，并赋予表达更复杂模式的能力。值得注意的是，尽管上述描述概括了典型的大规模预训练语言模型的设计原则，但对于特定版本如QwQ-32B的具体细节，则需参照官方文档获取最权威说明[^2]。 ```python import torch.nn as nn class TransformerModel(nn.Module): def __init__(self, vocab_size, d_model=512, nhead=8, num_encoder_layers=6, num_decoder_layers=6, dim_feedforward=2048, dropout=0.1): super().__init__() self.embedding = nn.Embedding(vocab_size, d_model) self.positional_encoding = PositionalEncoding(d_model, dropout) encoder_layer = nn.TransformerEncoderLayer( d_model=d_model, nhead=nhead, dim_feedforward=dim_feedforward, dropout=dropout ) decoder_layer = nn.TransformerDecoderLayer( d_model=d_model, nhead=nhead, dim_feedforward=dim_feedforward, dropout=dropout ) self.transformer = nn.Transformer( d_model=d_model, nhead=nhead, num_encoder_layers=num_encoder_layers, num_decoder_layers=num_decoder_layers, custom_encoder=nn.TransformerEncoder(encoder_layer, num_encoder_layers), custom_decoder=nn.TransformerDecoder(decoder_layer, num_decoder_layers) ) def forward(self, src, tgt): src_emb = self.positional_encoding(self.embedding(src)) tgt_emb = self.positional_encoding(self.embedding(tgt)) output = self.transformer(src_emb, tgt_emb) return output ```

DeepSider插件正式接入阿里QwQ-32B模型

性能强劲

​成本碾压

普通用户如何使用QwQ-32B？

DeepSider插件安装方法

成本碾压