• 博客(195)
  • 收藏
  • 关注

原创 技术解码:Character.ai 如何实现大模型实时推理性能 2 倍提升

Character.ai与DigitalOcean、AMD深度协同,通过从DP1/TP8/EP8到DP2/TP4/EP4的配置演进及FP8等优化,实现推理吞吐量翻倍,达成千万美元级合作。

2026-01-16 14:06:06 1567 1

原创 DigitalOcean 赋能 Character.ai:推理吞吐量翻倍,成本直降 50%

DigitalOcean的推理云平台与AMD Instinct™ MI300X/MI325X GPU深度协同,成功将Character.ai的生产环境推理吞吐量提升2倍。该平台通过硬件感知调度和优化运行时,在严格延迟标准下,使单Token成本降低50%,并支持日均10亿次查询的高并发需求。

2026-01-15 14:24:30 1329

原创 DigitalOcean容器注册表推出多注册表支持功能

此前,虽然一个 DigitalOcean 容器注册表(DOCR)账户可以创建多个团队,但每个团队仅限于一个容器注册表。通过此次更新,专业版计划的客户现在可以在单个团队下创建最多 10 个注册表,每个注册表都包含其独立的一组仓库和配置。此架构专为管理不同环境(如开发、预发布、生产)或分布式团队的用户设计,允许进行分隔化的注册表管理。

2026-01-12 21:10:03 675

原创 英伟达、AMD 同步涨价,企业如何锁定 2026 年的低价 GPU 云算力?

当算力变成一种像石油一样的“战略储备”时,等待往往意味着更高的成本。在英伟达和 AMD 全线调价的倒计时里,提前布局稳定的云端资源,或许能让你在 2026 年的 AI 竞赛中省下一大笔不必要的开支。

2026-01-08 13:06:40 1968

原创 Ubuntu服务器快速上手:初始配置与安全设置教程

如果意外地在命令中添加了尾部斜杠,rsync 将复制 root 账户 ~/.ssh 目录的*内容*到 sudo 用户的主目录,而不是复制整个 ~/.ssh 目录结构。文件将位于错误的位置,SSH 将无法找到并使用它们。要使用 SSH 密钥以普通用户身份登录,您必须将本地公钥的副本添加到您新用户的 ~/.ssh/authorized_keys 文件中。由于您的公钥已经在服务器上 root 账户的 ~/.ssh/authorized_keys 文件中,您可以使用当前会话将该文件和目录结构复制到您的新用户账户。

2026-01-07 15:18:38 769

原创 2026 年云 GPU 服务商选型指南:如何为 AI 工作负载选到真正高性价比的算力平台

本文围绕 2026 年云 GPU 市场,结合训练、微调与推理等典型 AI 工作负载,对比主流平台差异,给出兼顾性能、成本与开发体验的选型方法论。

2026-01-06 15:37:08 2178

原创 长文档也能稳健推理:QwenLong-L1.5 的记忆增强架构与实战部署指南

QwenLong-L1.5模型,通过后训练与内存框架解决长上下文推理难题,支持超长文档处理,并推荐在DigitalOcean GPU上部署。

2026-01-04 16:47:35 1297

原创 Ubuntu/Debian VPS 上 Apache Web 服务器的完整配置教程

在虚拟主机定义内部,包含服务器如何处理文件系统中不同目录的配置。Apache 将按路径从短到长的顺序应用这些规则,因此后续配置可覆盖先前设置。

2025-12-31 14:02:25 843

原创 加速 JavaScript 开发:DigitalOcean 应用托管现已原生支持 Bun

App Platform 现已原生支持 Bun 运行时,无需配置即可享受极速构建与部署,为现代 JavaScript 应用提供全栈加速。

2025-12-29 15:28:05 993 1

原创 想在云上低成本部署高性能Agent?MiniMax-M2 + DigitalOcean实战指南

A:模型用 … 把中间推理与最终答案分开,方便多轮对话中保持连贯的逻辑链。

2025-12-26 15:29:21 1194

原创 从零开始,用 n8n 设计可扩展的自动化工作流

n8n 是一个基于节点(node)的开源工作流自动化平台,工作流中的每一步都以一个节点表示。它与 Zapier 等工具类似,但在灵活性和对高级、AI 驱动自动化流程的支持方面更强。如果你在日常工作中还没有使用 AI 自动化工具,很可能正在错失巨大的效率提升机会。通过 n8n,你可以轻松连接各种应用、服务与 API。借助 DigitalOcean 的一键应用(1-Click App),你可以在安全、可扩展的DigitalOcean Droplet 云服务器上快速部署 n8n,无需复杂配置。

2025-12-24 16:07:54 814

原创 代码优先!DigitalOcean Gradient AI 知识库迎来重大升级

DigitalOcean近期升级了Gradient AI知识库功能,推出全新“代码优先”体验。该功能允许开发者完全通过代码创建、管理和查询知识库,以简化构建RAG系统的流程。目前此增强功能已进入公共预览阶段。

2025-12-23 11:48:39 559

原创 DigitalOcean推出AI智能体开发套件(ADK),让你的 AI Agent 从原型走向可用

这是一款代码优先的 SDK,支持你直接在现有开发环境中构建、测试和部署多步骤智能体工作流,兼容 LangGraph、LangChain、CrewAI 等主流 Python 智能体框架及自定义智能体系统。全球开发者正面临一个共同的难题:构建 AI 智能体的原型越来越简单,但要将其转化为可靠、可测试、可投入生产的方案却愈加困难。编排大语言模型交互、管理运行状态、连接函数调用、集成多种工具、评估性能表现、追踪故障原因以及部署到生产环境,往往需要编写复杂的定制代码并依赖零散的工具组合。

2025-12-22 15:42:14 1111 1

原创 日处理数千万 IoT 消息,Datacake 如何利用 DigitalOcean 扩展全球业务

2015 年,当 Lukas Klein 与合伙人共同创立 Datacake 时,想法其实很简单:让物联网(IoT)变得更容易。“那时候,”Lukas 回忆说,“它已经被称为 IoT 了,但大家并不真正清楚 IoT 到底意味着什么。”在与德国工业企业合作的过程中,Lukas 和他的团队发现了一个共性问题——许多客户都面临着类似的数据连接难题。正是在这种背景下,他们决定打造一款能够解决这一问题、并且具备可扩展性的产品:​。

2025-12-19 15:36:44 648

原创 Mistral 3 模型解析与部署实战:从 Large 3 到 Mini-stral

本文系统介绍 Mistral 3 开源模型家族,解析 Large 3 与 Mini-stral 的能力差异、硬件需求与适用场景,并演示在 DigitalOcean GPU 上的实际部署流程,帮助开发者低成本落地大模型应用。

2025-12-18 15:57:20 1231

原创 NVIDIA HGX™ B300 GPU Droplet 服务器,即将上线DigitalOcean 云平台!

人工智能正以史无前例的速度演进,新的模型和繁重的负载不断突破可能的边界。从复杂的大型语言模型(LLM)到精密的科学模拟,开发者与企业都需要获得最强大、最高效的算力基础设施。在 DigitalOcean,我们致力于提供顶级的算力资源,让你的团队能够以简单且经济的方式构建、部署并扩展 AI 项目。因此,我们激动地宣布:即将推出由加速的,这标志着我们 GPU 产品的一次重大升级。目前,中国区及亚太企业可与预约测试和预定。

2025-12-16 13:53:43 2683

原创 B300 GPU 服务器即将上线,它究竟比 B200、H200 强在哪?

解读 B300 对比 B200/H200 的关键差异与选型建议,介绍 DigitalOcean B300 GPU Droplet 预订通道。

2025-12-11 17:02:32 2412

原创 DigitalOcean 远程 MCP 正式上线,让基础设施“开口说话”

DigitalOcean 现已推出远程 MCP 服务,允许开发者直接通过 AI 助手以自然语言安全管理和操作云端资源,无需本地依赖,配置更简单。

2025-12-10 13:56:49 1234 1

原创 DigitalOcean AI 智能体评估功能全新升级:更快速,更深入

评估 AI 智能体并非易事,尤其当现有工具无法契合你的思维和工作方式时。为此,我们很高兴宣布,DigitalOcean Gradient™ AI 平台中的智能体评估功能现已全面升级。新版本将帮助你更快速、更轻松地评估 AI 智能体、理解结果并定位问题。

2025-12-09 16:23:55 399

原创 卓普云亮相曼谷Traffic Connect,与50+企业共话全球增长

杨刚首先介绍,卓普云科技由 DigitalOcean 控股股东 Access Technology Ventures 在中国设立,是 DigitalOcean 中国区独家战略合作伙伴,旨在帮助中国企业以更简单、透明、高性价比的方式使用 DigitalOcean 的全球云资源,并协助其更好服务出海客户。数据显示,从其他云平台迁移到 DigitalOcean 的客户,平均可节省超过 35% 的整体成本,在部分 AI 场景中节省幅度最高可达 75%。​,在 2 小时中实现面对面的紧密交流,共探出海合作机遇。

2025-12-08 16:26:51 1144

原创 开源视频生成新标杆:美团LongCat Video全面解析与实战指南

LongCat Video 的精妙之处在于其核心架构。这是因为他们非常巧妙地设计了一个单一管道来处理多项任务,包括文本到视频、图像到视频和视频延续。他们认为,所有这些任务都应被定义为视频延续,即模型根据给定的一组前置条件帧来预测未来的帧。为了实现这一点,他们采用了相对标准的扩散变换器架构,并配有单流变换器块。“每个块包含一个 3D 自注意力层、一个用于文本条件的交叉注意力层,以及一个带有 SwiGLU 的前馈网络。为了进行调制,他们利用了 AdaLN-Zero,其中每个块都包含一个专用的调制 MLP。

2025-12-03 15:13:05 1348 1

原创 碾压GPT-5,Qwen3-VL开源多模态新标杆:99.5%长视频定位准确率

在发布 Qwen3-VL 数月后,阿里巴巴近日发布了这款开源多模态模型的详细技术报告。数据显示,该系统在基于图像的数学任务上表现出色,并能分析数小时的视频内容。该模型可处理海量数据,在 25.6 万 token 的上下文窗口内,轻松处理两小时长的视频或数百页的文档。在“大海捞针”(needle-in-a-haystack)测试中,其旗舰版 2350 亿参数模型能在 30 分钟视频中以 100% 的准确率定位单个关键帧。即使在包含约 100 万 tokens 的两小时视频中,其准确率仍高达 99.5%。

2025-12-01 17:05:06 1704

原创 简化工作流:DigitalOcean App Platform 正式支持环境管理

作为开发者,DigitalOcean 的团队同样热爱构建各种各样的应用,但也深知随着应用组合不断增长,管理它们会变得越来越复杂。生产服务、staging 环境和新功能分支部署之间的界限可能变得模糊不清。快速识别哪些应用属于哪个用途,并一眼看清所有“生产”应用,已成为一项重大的组织挑战。

2025-11-26 15:45:46 356

原创 AI 训练与游戏出海的新选择:比 AWS EFS 更便宜、更透明的企业级云存储来了

​:你只需要为存储空间付费,剩下的性能、流量、请求次数,全部打包在内。

2025-11-25 16:03:15 1586

原创 教程:利用智源悟界Emu3.5,生成可视化任务指南

Emu3.5 可以说是近期图像生成领域最具突破性的技术之一。它能把图像和文本交替生成,组合成故事或操作指南,这让 LLM 与视觉能力真正集成到了可解决实际问题的方向。此外,Emu3.5 本身也是非常强大的图像生成和编辑模型。我们非常推荐使用 Emu3.5 来创作视觉指导内容或图像编辑任务。它在多个维度上都领先于同类模型。

2025-11-21 14:57:28 1225

原创 DigitalOcean 开发者沙龙上海站落幕:五大硬核议题拆解 AIGC 落地的真实挑战

随着五位嘉宾的深度分享,本次 DigitalOcean 开发者沙龙以完整的技术链路,呈现了 AIGC 落地过程中最重要的四个底座:​算力、存储、知识结构化与高效推理​。从硬件到软件、从本地到云端、从模型工具链到工程优化,每一个环节都在快速迭代,而这也意味着企业与开发者正站在一个前所未有的创新窗口期。

2025-11-18 18:01:14 351

原创 基于AI Agent模板:快速生成 SQL 测试数据

Gradient AI 平台是 DigitalOcean 提供的一个一体化 AI 云服务平台,覆盖从生成式模型调用、智能 Agent 构建、GPU 服务器(如 H200、H100、RTX 6000 等按需/裸金属)、到 Serverless 推理服务的完整流程。Agent Templates 是在​​ 平台上构建的、以代码为核心的即插即用入门套件。每个模板都是一个 Python 项目,你可以在几分钟内克隆、配置并部署。

2025-11-13 16:29:39 856

原创 零门槛部署:在AMD MI300X上极速部署运行GPT-OSS 120B全流程实践

vLLM 是一个开源的高性能推理引擎,专为以卓越的速度和内存效率提供大型语言模型(LLM)服务而设计。通过优化 GPU 内存利用率,vLLM 比许多其他竞争方案提供更快的响应速度、更高的吞吐量和更低的延迟。其核心创新包括 PagedAttention 算法、对连续批处理的支持,以及与 Hugging Face 等主流模型生态系统的无缝兼容性。我们推荐使用 vLLM,正是基于这些优势特性。

2025-11-12 16:00:01 2095

原创 广告平台在 AI 时代如何选择 GPU 与云平台?

在广告科技的竞争赛道中,AI 已成为制胜关键,而 GPU 则是支撑这一切的核心引擎。广告平台若要在实时竞价、创意生成与智能定向上保持领先,就需要兼顾性能、成本与部署效率。DigitalOcean 通过其 GPU Droplet 产品,让广告团队能够以更低成本、更快速度构建 AI 驱动的广告系统。无论是初创的广告优化团队,还是全球化的 Ad Network,都能在这一平台上实现灵活扩展与高效运行。未来的广告,不只是创意之争,更是算力​与智能的竞赛。选择合适的 GPU 云平台,正是赢得这场竞赛的起点。

2025-11-11 16:41:25 1412

原创 在 DigitalOcean GPU 云服务上使用 LangChain 构建Serverless AI 应用

全新的兼容现有 LangChain 代码的即插即用​​方案​:只需几行代码即可切换到 Gradient AI 的推理端点,无需重写或重构。​**延续 LangChain 的熟悉抽象(Chains、Tools、Agents)**​:继续使用你熟悉的构建方式——组合链、接入工具、启动智能体,无需更改工作流。​多模型可选​:在 DigitalOcean 上即时访问多种 GPU 加速的 Serverless AI 模型。​开放与灵活。

2025-11-07 17:48:38 2062

原创 AI 推理 GPU 选型指南:从 A100 到 L40S 再看 RTX 4000 Ada

如果你的部署以 ​推理为核心​,且预算敏感、在线服务需求强烈,选择 L40S 为高性价比路线。如果你的需求兼顾 ​训练 + 推理​、模型规模极大、预算容许,A100 仍是稳妥之选。如果你的预算极端受限、模型规模小、功耗敏感,则 RTX 4000 Ada Generation 可成为实际可用选项。最终,正确的选型不是追求“最强”而是匹配你的任务需求、预算结构与部署背景。希望本文能为你的 GPU 选型决策提供清晰、理性的指导。在 AI 模型日新月异的今天,选择合适的 GPU 云平台至关重要。

2025-10-31 17:16:36 2681

原创 裸金属 vs. 虚拟化 GPU 服务器:AI 训练与推理应该怎么选

AI 基础设施的选择,本质上是“性能”与“弹性”的权衡。​裸金属服务器代表确定性与极致算力​​,虚拟化服务器代表敏捷与成本效率。​成熟的团队会根据任务阶段动态切换两种架构——在开发阶段快步试错,在生产阶段稳定提速。当 AI 成为业务的核心生产力,算力架构的每一个选择,都将成为你竞争力的放大器。

2025-10-30 17:47:26 1942

原创 利用腾讯开源 Hunyuan3D 2.1:在 DigitalOcean GPU Droplet 上快速搭建 3D 模型

它主要由两个完全公开的基础模型组成,即 Hunyuan3D-DiT ——“一种结合了基于流的扩散架构与高保真网格自编码器(Hunyuan3D-ShapeVAE)的形状生成模型”,以及 Hunyuan3D-Paint ——“一种基于网格条件的多视角扩散模型,用于生成 PBR 材质,产出高质量、多通道对齐且视角一致的纹理”。例如,在上文示例中,我们可以看到被极度拉长的尾巴和地面平台。你将全面掌握从图像生成、环境配置到 3D 模型导出的完整流程,亲身感受 AI 如何以前所未有的速度和效率,实现你的 3D 创意。

2025-10-29 16:33:35 1807

原创 深度学习零基础教程:在 DigitalOcean GPU 云主机上一步搭建 Jupyter Lab

在本教程中,我们将逐步介绍如何在上搭建 Jupyter Lab 或 Jupyter Notebook 实例。此外,我们还会分享一些关键技巧,帮助你在 Jupyter Notebook 中顺利运行深度学习代码。

2025-10-29 15:16:08 1432

原创 DigitalOcean Gradient™ 平台上线 fal 四款多模态 AI 模型:快速生成图像与音频

DigitalOcean 云平台近期宣布,来自 fal.ai 的四个多模态 AI 模型已在上架,现在可通过 Serverless Inference 以公开预览版的形式使用。借助这些模型,你可以直接通过 API 生成图像和音频,无需操心基础设施、扩缩容或供应商管理。此次发布后,构建包含视觉与音频内容的 AI 驱动应用变得前所未有的简单。对于不熟悉的开发者来说,这里简单介绍一下。它是一家专注于为提供的公司。简单来说,fal.ai 致力于解决 AI 模型推理速度慢、部署复杂的问题。

2025-10-24 17:10:52 1892

原创 DeepSeek-OCR 如何将你的 LLM 上下文提升 10 倍?原理、实践与云端部署指南

DeepSeek-OCR 是一款极具创新性和前瞻性的工具。它巧妙地利用视觉编码和 OCR 技术,将文档转换为视觉表示,从而有效地实现了​Token 消耗的降低、上下文长度的扩展和文档处理效率的提升​。无论您是进行大规模文档处理、高精度 OCR,还是需要扩展 LLM 的上下文窗口,DeepSeek-OCR 都值得您深入探索和实践。在云部署环节,​​ Droplet是一个优秀且可靠的选择:它具备操作简便、规格灵活、成本可控等优势。如果您决定尝试,选用1 个 H200 GPU。

2025-10-23 16:06:30 1493

原创 普通服务器都能跑:深入了解 Qwen3-Next-80B-A3B-Instruct

Qwen3-Next-80B-A3B-Instruct 拥有 ​800 亿参数​,但在推理过程中​仅激活 30 亿参数​,因此也被称为下一代基础模型。Qwen3-Next-80B-A3B 引入了混合注意力架构、​高稀疏度专家混合 (MoE​**)** 设计和​**多令牌预测 (MTP)**​,在吞吐量、成本效率和长上下文理解方面实现了显著改进。混合注意力结合了不同类型的注意力机制,可以更高效地处理信息。它使模型能够在不牺牲性能的情况下,同时关注​短期细节和长距离依赖关系​。

2025-10-21 16:40:44 1774

原创 Qwen 2509、Gemini、Flux谁是王者?顶级文生图AI模型能力对比

自诞生以来,图像生成一直是 AI 最受欢迎的用例之一,正如我们在本博客中广泛介绍的那样。从像和 Hi-Dream 这样的模型中,我们看到了大量资源投入到微调的开发中,由此产生的艺术作品令人惊叹。文生图模型(text-to-image models)能做的事情实在太多了——它让任何人都有可能将想象变为现实。但这些模型并非完美无缺。通常,一张本应完美的图像会被一些微小的瑕疵或错误破坏。例如,图像模型曾经有一个臭名昭著的弱点,那就是在处理时会遇到困难,这使得在野外很容易识别出 AI 生成的图像。

2025-10-17 16:13:44 2087

原创 AI 图像编辑新玩法:用 Qwen Image Edit 2509 一键实现虚拟试衣

我们先来分解一下整个 Web 应用的结构。在下面的应用代码中,我们添加了注释,帮助你理解其主要内容与逻辑。gap:.5rem;gr.on(gr.on(正如我们所看到的,这个应用的代码相当简洁。它主要由两个函数组成: 一个用于通过Diffusers加载模型及其对应的 LoRA,另一个用于运行服装提取或虚拟试衣流程。前者在单张图像上进行服装提取,后者使用两张图像完成服装试穿。最终,程序会生成一张.webp格式的输出图像,可直接预览或下载。在这个过程中,真正承担主要计算任务的是。

2025-10-14 16:18:53 2241

原创 NVIDIA HGX H100 GPU 服务器现已在 DigitalOcean 欧洲数据中心上线

对资源的需求,尤其是用于的需求,正持续呈指数级增长。我们深知,欧洲的开发者和企业需要简单、地访问强大的,以保持他们的创新渠道快速发展。同时,也有不少中国及其他地区的企业希望在欧洲的数据中心使用 GPU 服务器。DigitalOcean 近日宣布,现已作为——DigitalOcean 的按需实例——在。和。wp:heading。

2025-10-10 14:55:57 3887

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除