- 博客(4)
- 收藏
- 关注
原创 吊打5090?终极核弹RTX PRO 6000评测
其拥有更接近完整的GB202核心——24064 个 CUDA 核心(比 RTX 5090 上的GB202多 10.5%规模);搭配96GB(支持 ECC 纠错),是 RTX 5090(32GB GDDR7)的三倍显存容量。
2026-04-21 10:37:19
216
原创 从 RTX 到 Spark:NVIDIA 为本地代理式 AI 加速 Gemma4
Unsloth 提供首日支持,通过 Unsloth Studio 提供经过优化和量化的模型,以实现高效的本地微调和部署。它使用 NVIDIA GPU 在本地运行开放权重模型,同时通过混合路由器在本地 RTX 硬件与云端之间动态平衡工作负载,无需调用 API Key,即可实现快速、私密、零配置的执行体验。这些优化模型以便捷的方式提供业界领先的推理能力,可在 NVIDIA RTX GPU 和 DGX Spark 上高效运行,为开发环境、编码助手和智能体驱动的工作流提供动力。为顺应这一转变,Google 的。
2026-04-13 14:33:04
331
原创 DGX Spark 跑 Qwen3.5-35B-A3B 实测43tok/s
主要踩坑记录: - openclaw 发的请求里有 developer role,Qwen3.5 的模板不认,直接 500 ❌ - 工具调用返回用的是 toolResult,Qwen3.5 只认 tool,又是 500 ❌ - 默认开启 thinking 模式,模型把所有 token 都花在推理上,返回内容为空 ❌ 解决方案: 写了一个小代理层,自动处理所有兼容性问题。支持在消息开头加 [think] 关键词按需开启深度推理模式,其他情况下正常快速响应。
2026-04-01 15:05:04
96
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅