AI算力服务器-慧慧-CSDN博客

原创吊打5090？终极核弹RTX PRO 6000评测

其拥有更接近完整的GB202核心——24064 个 CUDA 核心（比 RTX 5090 上的GB202多 10.5%规模）；搭配96GB（支持 ECC 纠错），是 RTX 5090（32GB GDDR7）的三倍显存容量。

2026-04-21 10:37:19 216

原创 NVIDIA RTX PRO 6000 工作站 GPU 深度评测：Blackwell 架构+ 96 GB 显存无可替代！

Sjhhh0228

2026-04-16 13:31:30 1190

原创从 RTX 到 Spark：NVIDIA 为本地代理式 AI 加速 Gemma4

Unsloth 提供首日支持，通过 Unsloth Studio 提供经过优化和量化的模型，以实现高效的本地微调和部署。它使用 NVIDIA GPU 在本地运行开放权重模型，同时通过混合路由器在本地 RTX 硬件与云端之间动态平衡工作负载，无需调用 API Key，即可实现快速、私密、零配置的执行体验。这些优化模型以便捷的方式提供业界领先的推理能力，可在 NVIDIA RTX GPU 和 DGX Spark 上高效运行，为开发环境、编码助手和智能体驱动的工作流提供动力。为顺应这一转变，Google 的。

2026-04-13 14:33:04 331

原创 DGX Spark 跑 Qwen3.5-35B-A3B 实测43tok/s

主要踩坑记录： - openclaw 发的请求里有 developer role，Qwen3.5 的模板不认，直接 500 ❌ - 工具调用返回用的是 toolResult，Qwen3.5 只认 tool，又是 500 ❌ - 默认开启 thinking 模式，模型把所有 token 都花在推理上，返回内容为空 ❌ 解决方案：写了一个小代理层，自动处理所有兼容性问题。支持在消息开头加 [think] 关键词按需开启深度推理模式，其他情况下正常快速响应。

2026-04-01 15:05:04 96

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 吊打5090？终极核弹RTX PRO 6000评测

原创 NVIDIA RTX PRO 6000 工作站 GPU 深度评测：Blackwell 架构+ 96 GB 显存无可替代！

原创 从 RTX 到 Spark：NVIDIA 为本地代理式 AI 加速 Gemma4

原创 DGX Spark 跑 Qwen3.5-35B-A3B 实测43tok/s

空空如也

空空如也

原创吊打5090？终极核弹RTX PRO 6000评测

原创从 RTX 到 Spark：NVIDIA 为本地代理式 AI 加速 Gemma4