• 博客(147)
  • 收藏
  • 关注

原创 PPIO入选量子位2026年度值得关注的AIGC企业&产品两项大奖

今天的 AI 正从会聊天的 Chat 进化到会干活的 Agent,对于底层智能体基础设施提出了更多的专属需求。入选企业或在技术纵深上持续突破,或在商业化落地上跑通了闭环,或在垂直场景里扎下了深根,凭借扎实的技术创新能力与可验证的产业实践,共同推动 AIGC 从“可用”走向“好用”,从“试点”走向“常态”。近日,PPIO 入选量子位发布的“2026 年度值得关注的 AIGC 企业”与“2026 年度值得关注的 AIGC 产品”两大榜单,与智谱、MiniMax、阿里、腾讯等企业同台获奖。

2026-05-21 17:50:36 220

原创 PPIO参展2026上海信息消费节,全栈式AI云产品亮相

PPIO 沙箱基于 Firecracker microVM 的高性能技术架构,通过 KVM 硬件级隔离,从根本上解决了容器安全边界不足的问题——既能支持 Agent 所需的完整系统能力,又能实现多租户间的强隔离。PPIO 产品专家胡昕媛现场分享了主题为《云端 Agent 为何需要一个 Sandbox》的演讲,拆解了 Agent 落地生产环境的核心挑战,并分享了 PPIO 在 Agent Infra 领域的最新实践。作为“Token 经济”的全栈式 AI 原生云代表企业,PPIO 受邀参展并做主题分享。

2026-05-19 18:12:52 226

原创 三家国产模型跻身Coding Agent全球前十,PPIO一站式接入

本周,Artificial Analysis 发布了一套针对 AI 编程代理(Coding Agent)的综合基准测试体系。其中,国产大模型 GLM-5.1、Kimi K2.6、DeepSeek V4 Pro 表现亮眼,在全球 AI 编程代理的 Top10 里占据三席,与 Claude-4.7、GPT-5.5 同台竞技。现在,越来越多的编码代理场景开始选择国产模型,这一趋势在 PPIO 的 MaaS 平台也得到体现。截止 2026 年 4 月,PPIO 的日均 tokens 调用量超过 10000 亿。

2026-05-19 16:04:10 367

原创 Hermes Agent反超OpenClaw登顶全球调用量榜首,这是一份无门槛使用教程【附代金券】

在 AI Agent 赛道,GitHub 星标和发布声量曾是衡量产品热度的主要指标,但真正的战场正在转向真实使用量。5月9日,开源自进化 Agent 产品 Hermes 登顶 OpenRouter 全球应用调用量榜首,单日 Token 消耗量达到 2710 亿,首次超越此前长期霸榜的 OpenClaw。这不仅是一次排名变化,更标志着 AI Agent 开始接受真实用量的检验——谁能真正被用户高频调用、承接复杂任务,谁才有资格站在牌桌上。

2026-05-15 11:07:44 344

原创 如何保障AI代码安全运行?深入拆解PPIO沙箱五大Agent实战场景

本文聚焦在“为什么选 microVM 沙箱”——执行环境的选择逻辑。但 PPIO 沙箱还有更多值得深入的能力:Snapshot 如何在 Agentic RL 中支撑万级并发的分支探索?Template 如何把 Agent 的冷启动压到极限?Auto Pause 的空闲检测机制是怎么工作的?下一篇文章,我们继续拆解Snapshot、Template 与 Auto Pause 背后的工程细节,敬请期待。

2026-05-09 12:06:27 378

原创 新品内测|延迟从500ms降至50ms!PPIO Sandbox TURN发布,彻底打通Agent实时交互网络

PPIO Sandbox TURN,打通 Agent Sandbox实时通信通路。进入 Agent 时代,云沙箱(Sandbox)已成为智能体执行代码、调用工具、操作浏览器的基础设施。不是带宽不够,而是专为实时类 Agent 应用优化,一举将端到端延迟从 300-500ms 暴降至 50-100ms。

2026-04-24 17:43:18 355

原创 PPIO王闻宇:为什么云端Agent需要专属沙箱?

4月19日,TiDB 联合亚马逊云科技、PPIO 等伙伴,在北京举办 AI Founders Meetup。PPIO 联合创始人兼 CTO 王闻宇受邀出席,并依托对 Agent Infra 趋势判断,现场分享《为什么云端Agent需要专属沙箱?》主题。PPIO 沙箱是专为 Agent 场景设计的新一代运行时基础设施,提供了一个安全隔离的云端沙箱环境来执行 AI 生成的代码,是国内首款兼容 E2B 的沙箱产品。

2026-04-22 11:55:41 408

原创 PPIO上线GLM-5.1:面向8小时级长程任务的开源SOTA模型

该模型能够更准确地处理模糊问题,并在更长的运行时间内保持高效,能够分解复杂问题,运行实验,解读结果,并精准地识别障碍。GLM-5.1 在 SWE-Bench Pro 测试中取得了最先进的性能,并在 NL2Repo(代码库生成)和 Terminal-Bench 2.0(真实终端任务)测试中大幅领先于 GLM-5。如果你是 PPIO 老用户,可参与 PPIO 的邀请返利活动。邀请朋友注册 PPIO ,最高享受 15% 的好友充值返利,单笔充值金额上不封顶,详情可到“PPIO控制台-我的-邀请返利”活动页查看。

2026-04-08 14:44:47 78

原创 PPClaw “省钱模式”上线:暂停期间零计费

PPClaw v1.8.0推出全新On-Demand按需模式,实现"用时付费、闲时省钱"。该模式下沙箱空闲时自动暂停(可自定义300-86400秒超时),暂停期间零计费,请求到达时1秒恢复。支持手动暂停/恢复、运行时修改配置,并具备Cron任务预唤醒功能。更新还优化了CLI命令和API管理功能,特别适合低频使用场景。提供一键安装脚本,支持macOS/Linux/Windows系统。当前7天免费试用持续开放,用户可升级体验这一省钱的沙箱运行模式。

2026-04-03 17:02:27 335

原创 PPIO×AionUI:告别繁琐配置,构建多智能体协作的 AI 工作台

AionUI 是由 iOfficeAI 团队打造的免费开源 AI 协作桌面应用,它不只是聊天客户端,更是一个 AI Cowork 平台,内置 AI Agent 安装即用,12 个专业助手覆盖 PPT 生成、Excel 处理、UI 设计等办公高频场景,同时集成 OpenClaw 等多代理模式,数据全部本地存储,安全可控。下载完成后,打开AionUI,在设置-模型界面中点击“添加模型”,模型平台选择PPIO,并输入先前复制的API密钥,点击确认完成配置。:密钥在服务端是加密存储,请在生成时保存好密钥;

2026-03-19 13:37:13 338

原创 PPIO上线MiniMax M2.7:一个深度参与迭代自己的模型

PPIO 平台在第一时间上线了 MiniMax M2.7 模型

2026-03-19 11:58:20 417

原创 Agent 部署的终极答案?PPClaw 让 OpenClaw 告别“最后一公里”难题

在 AI Agent 落地的赛道上,“能落地、易落地”才是核心竞争力。PPClaw 只需一条命令部署,重新定义了 OpenClaw 的云端托管体验,无论是小团队快速试错,还是企业级稳定部署,都能轻松适配。现在,复制文中的安装命令,获取你的 PPIO API Key,快速拥有属于自己的 AI 沙箱环境,让 OpenClaw 真正落地到你的业务场景中,告别部署“最后一座山”,解锁 AI Agent 的无限可能。

2026-03-06 10:37:57 391

原创 Qwen3.5重磅发布 PPIO 模型服务平台同步上线

Qwen3.5 系列模型堪称 “性能与效率的完美平衡体”,总参数3970 亿,激活 170 亿参数即可运转,实现了 “以小胜大” 的技术突破 —— 性能全面超越万亿参数的 Qwen3-Max 模型,同时部署显存占用直降 60%,最大推理吞吐量提升至 19 倍。AI 技术的落地,贵在 “快人一步”。PPIO 模型服务平台在第一时间完成 Qwen3.5-Plus 与 Qwen3.5-397B-A17B 双版本的全面适配与上线,让企业与开发者无需等待,即可率先享受新一代多模态大模型的技术红利。

2026-02-16 21:25:34 371

原创 PPIO 上线 MiniMax M2.5:体验架构师级编程与高效 Agent 能力

MiniMax M2.5 是 MiniMax 发布的最新旗舰模型。该模型优化了对复杂任务的拆解能力,大幅提升了运行速度,并凭借极佳的 Token 效率,让无限运行复杂 Agent 在经济上成为可能。模型在超过 10 种编程语言(如 Go、C++、Java 等)和数十万个真实环境中进行了训练,在多语言任务 Multi-SWE-Bench 评测中排名第一,展现了覆盖 Web、移动端及服务端的全栈开发能力。通过架构师级的编程思维与极致的成本控制,该模型为构建高效、经济的自动化应用提供了强有力的底层支持。

2026-02-13 11:20:11 787

原创 全网首发!PPIO 上线智谱 GLM-5 ,解锁 Agentic 长程执行力

GLM-5 展现出了类似资深架构师的统筹能力,它能够自主将一个庞大模糊的目标,拆解为清晰、可执行的具体步骤。更重要的是,在长达数小时甚至更久的自动化任务执行过程中,该模型能够始终保持上下文的连贯性,确保每一个步骤都与最终目标保持一致,有效解决了传统模型在长任务中容易“遗忘”或“偏航”的痛点。当面对编译失败或运行时报错等棘手问题时,GLM-5 并非简单地抛出建议,而是能够像经验丰富的工程师一样,自主分析系统日志,精准定位问题根因,并进行迭代式的修复尝试,直至系统完全跑通。,该模型为智谱新一代的旗舰基座模型,

2026-02-12 02:06:41 530

原创 PPIO上线Qwen3-Coder-Next:智能体效率王者,重新定义低成本开发

PPIO首发上线Qwen3-Coder-Next模型。这是一款专为编程智能体与本地开发设计的开源权重语言模型,在面向低成本代码智能体部署方面具有较为明显的优势。

2026-02-04 15:01:54 554

原创 PPIO上线GLM-OCR:0.9B参数SOTA性能,支持一键部署

作为一款兼具“轻量化”与“高精度”的专业级 OCR 模型,GLM-OCR 以 0.9B 的参数规模,在 OmniDocBench V1.5 基准测试中取得了 94.6 分的 SOTA 表现,并在公式识别、复杂表格解析及信息抽取等高难度场景中展现出显著优势。目前,PPIO算力市场已上线几十个私有化部署模板,除了 GLM-OCR,你也可以将DeepSeek-OCR-2、 AutoGLM-Phone-9B、 GLM-Image、PaddleOCR-VL 等模型快速进行私有化部署。稍等一会,实例创建需要一些时间。

2026-02-03 16:17:39 653

原创 PPIO 上线 PaddleOCR-VL-1.5 :小参数高性能 | 一键部署

PPIO算力市场推出PaddleOCR-VL-1.5模型模板,该轻量级模型(0.9B参数)在OmniDocBenchv1.5评测中达到94.5%精度,支持异形框定位、印章识别等功能,优化了复杂场景下的文档解析。用户可通过PPIO平台一键部署,快速体验模型能力。部署流程包含模板选择、配置确认等简单步骤,并提供完整的API调用示例。PPIO算力市场已上线多个OCR及大模型模板,大幅降低私有化部署门槛。

2026-01-30 14:40:40 504

原创 PPIO 上线 DeepSeek-OCR-2 ,支持一键私有化部署

PPIO 算力市场首发上线了 DeepSeek-OCR-2 部署模板,为开发者提供开箱即用的模型服务。DeepSeek-OCR-2 是 DeepSeek 团队最新发布的开源 OCR 模型。与传统 OCR 方案不同,该模型引入了 DeepEncoder V2 视觉编码器,并采用了“视觉因果流(Visual Causal Flow)”技术。这一架构改变使得模型能够基于语义逻辑理解文档结构,从而在处理多栏排版、复杂表格以及图文混排场景时表现出更高的准确性。

2026-01-28 15:07:00 445

原创 PPIO 上线 Kimi K2.5:体验原生多模态与 Agent 集群能力

PPIO正式上线KimiK2.5开源模型,这是月之暗面发布的最新多模态AI系统。该模型采用原生多模态架构,支持视觉与文本输入,在Agent集群、代码编程、图像视频理解等方面达到开源领域SOTA水平。其创新性包括:支持100个并行Agent协作处理复杂任务,效率提升4.5倍;强化代码能力,配套推出KimiCode开发工具;降低交互门槛,可解析图像/视频并生成代码。目前用户可通过PPIO官网体验或调用API。

2026-01-28 14:57:56 763

原创 PPIO × 商汤 LazyLLM: 一站式构建 Multi-Agent |实操指南

以上就是本次联合解决方案的完整实操指南。PPIO 的算力底座配合 LazyLLM 的一站式工具链,为 AI 应用开发提供了一条“即开即用”的捷径。我们希望通过这一标准化的流程,帮助大家从繁琐的底层调试中解放出来。目前,双方的适配已全面上线,欢迎各位开发者即刻接入体验,我们期待看到更多富有创造力的智能体应用在这一生态中诞生。

2026-01-22 15:39:11 683

原创 PPIO 上线 GLM-4.7-Flash 模板 | 极速部署教程

在执行复杂智能体任务,GLM-4.7-Flash 在工具调用时指令遵循更强,并大幅提升了 Artifacts 与 Agentic Coding 的前端美感和长程任务完成效率。GLM-4.7-Flash 作为 GLM-4.7 旗舰系列的“极速版”,总参数量为30B,激活参数量为3B,为用户提供了一个兼顾性能与效率的新选择。PPIO 的算力市场模板致力于帮助企业及个人开发者降低大模型私有化部署的门槛,无需繁琐的环境配置,即可实现高效、安全的模型落地。step 1: 子模版市场选择对应模板,并使用此模板。

2026-01-20 14:00:57 508

原创 PPIO 上线 GLM-Image 部署模板,10分钟拥有私有化模型

今天,PPIO 上线图像生成领域的重磅模型——智谱 GLM-Image。GLM-Image 利用基于GLM-4的自回归生成器进行精准的语义规划和布局,再通过扩散解码器完成高保真成像,从而具备了卓越的长文本理解力。其核心突破在于,在 CVTG-2K 基准中准确率超91%,彻底解决了AI生成海报文字乱码的行业痛点。结合GRPO美学强化学习策略,GLM-Image 在处理复杂空间关系、知识密集型绘图及图文排版任务上,展现出了远超传统纯扩散模型的表现力,是目前开源界“懂逻辑、会写字”的新一代视觉创作工具。

2026-01-14 14:25:21 371

原创 PPIO Agent 沙箱 × Claude Agent SDK :三步构建能写会跑的 Coding Agent

PPIO Agent 沙箱 与 Claude SDK 的集成为 AI Agent 开发提供了一种更高效、更自动化的工作流。它通过提供一个即时、隔离且可编程的执行环境,解决了传统 AI 编程中反馈链路过长和环境配置困难的核心问题。我们相信,这种让 AI Agent 能够直接与真实环境交互的模式,将是未来 AI 辅助软件开发的重要方向。

2026-01-09 10:30:57 973

原创 PPIO上线MiniMax-M2.1:聚焦多语言编程与真实世界复杂任务

M2.1 系统性提升了 Rust / Java / Golang / C++ / Kotlin / Objective-C / TypeScript / JavaScript 等语言的能力,多语言任务整体表现达到业内领先水平,覆盖从底层系统到应用层开发的完整链路。相比 M2,MiniMax M2.1 的模型回复以及思维链更加简洁,在实际编程与交互体验中,响应速度显著提升,Token 消耗明显下降,在 AI Coding 与 Agent 驱动的连续工作流中更加流畅和高效。

2025-12-24 10:09:49 674

原创 PPIO上线智谱最新旗舰模型GLM-4.7

GLM-4.7 的上下文窗口为 200K,最大输出 tokens 为128K,支持深度思考、交错式思考(Interleaved thinking)、流式输出、Function Call、上下文缓存、结构化输出、MCP 调用等能力。面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同,并在多个公开基准的当期榜单中取得开源模型中的领先表现。API 文档:https://ppio.com/model/zai-org/glm-4.7。PPIO 上线智谱最新旗舰模型 GLM-4.7。

2025-12-23 10:10:39 817

原创 PPIO上线Prompt Cache:让模型调用更快、更省、更稳

传统推理服务需要每次都重新计算相同的文本片段,导致不必要的计算开销和延迟,PPIO 推出的 Prompt Cache(提示词缓存)有效解决了这一问题。PPIO 一直致力于为用户提供更高效率、更低成本、更稳定可靠的算力与模型服务,通过持续优化 Prompt Cache 等关键技术能力,进一步提升模型服务性能,让大模型真正释放长期价值,驱动下一代应用创新。Prompt Cache 技术的普及,有效解决了当前大模型应用中“长文本贵、长文本慢”的核心痛点,为构建智能化、经济化的 AI 服务奠定了基础。

2025-12-18 18:06:26 657

原创 PPIO上线阿里Wan 2.6:制作电影级AI视频,对标Sora2

今天,PPIO 上线阿里最新发布的 Wan 2.6 视频生成模型。Wan 2.6 是一个用于生成高质量视频和图像内容的高级多模态 AI 模型,将文本、图像、视频和音频整合到一个无缝框架中,提供文生视频、图生视频和参考视频生成等功能。Wan 2.6 可生成 24fps 的 1080p 视频,具有原生音画同步和精确的口型同步。Wan 2.6 支持多语言内容创作,适用于社交媒体、营销、电影制作和电子商务应用。Wan 2.6 的主要优势有两个。一是增强生成质量。

2025-12-16 18:14:09 1426

原创 PPIO上线智谱AutoGLM-Phone-9B,快速体验Phone Agent

今天,智谱开源了 Phone Agent。Phone Agent 是一个基于 AutoGLM 构建的手机端智能助理框架,能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。这不仅是一个模型,而是一整套可以「拿来就用」的能力,包括基于该模型和框架,你可以搭建完整的 Phone Agent 应用,只需用自然语言描述需求,如“打开小红书搜索美食”,Phone Agent 即可自动解析意图、理解当前界面、规划下一步动作并完成整个流程。

2025-12-10 11:28:27 1498

原创 PPIO 上线 GLM-4.6V 多模态大模型

今天,PPIO 上线 GLM-4.6V 多模态大模型。GLM-4.6V 将训练时上下文窗口提升到 128k tokens,在,并首次在模型架构中将,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。在性能优化之外,系列相较于 GLM-4.5V,API 调用价格低至。现在,你可以到 PPIO 官网在线体验 GLM-4.6V,或将模型 API 接入 Cherry Studio 等 AI 应用中。新用户填写邀请码注册可得 15 元代金券。

2025-12-09 10:28:38 747

原创 PPIO x MosuMosu:用 AI Copilot 重新定义年轻人的追星体验

追星是一件充满情绪价值的事。MosuMosu 不只是一个工具,更是一个懂你的 AI 伙伴——你越跟它交互,它越懂你的追星心情。要想打造这样一个平台,需要足够强大与稳定的算力与 AI 模型能力的支撑。

2025-12-09 10:09:53 1137

原创 PPIO 上线 DeepSeek-V3.2 正式版,性能接近 Gemini-3.0-Pro

今天,PPIO 派欧云首发上线 DeepSeek 的最新模型——DeepSeek-V3.2,这是两个月前上线的的正式版。DeepSeek-V3.2 达到了 GPT-5 的水平,仅略低于 Gemini-3.0-Pro;同时推出了长思考增强版 DeepSeek-V3.2-Speciale(仅以临时 API 服务形式开放)。DeepSeek-V3.2 是 DeepSeek 推出的首个将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。

2025-12-02 10:34:02 1493

原创 PPIO发布Agent Runtime:让Agent部署像Serverless一样简单

面对容器,开发者需要管理生命周期,管理日志、监控、调度、扩容,管理镜像/版本,管理网络、权限、安全组,对小团队、需要快速迭代的 Agent 应用来说都是极高的负担。相比传统部署方式,PPIO Agent Runtime 通过简单易用的 SDK 与强大的沙箱运行环境来简化 Agent 的部署过程,用户无需关心基础设施配置、容器编排、服务暴露等复杂细节,只需专注于 Agent 的业务逻辑开发。PPIO Agent Runtime 通过简单易用的 SDK 与强大的沙箱运行环境来简化 Agent 的部署过程。

2025-11-26 14:24:36 901

原创 PPIO x 笔神作文批改:Deepseek如何赋能教育?

由于 DeepSeek 针对中文语料做过大量的预训练,对中文语料支持更好,表达的也更像中国人的方式,所以一经发布便成为中文任务的首选模型之一,而作文批改就是一个代表性应用场景。PPIO 模型 API 服务是面向企业客户与开发者推出的高性能推理服务平台,基于下一代分布式 AI 基础设施架构(AI Infra),提供稳定、低延迟、高性价比的大语言模型与多模态模型调用能力。对于教师而言,批改一篇作文平均需要 20 分钟,面对全班数十篇作文,这项工作耗时耗力,且难以保证评价标准的统一性和反馈的深度。

2025-11-25 10:22:50 1010

原创 算力集群覆盖全球六大洲,PPIO全力支持中国企业出海

PPIO 提供大容量带宽,将网络速度提升近 1000 倍,缩短模型下载和开发时间,将速度优势转化为商业竞争力,帮助企业在激烈的市场竞争中抢占先机。正因如此,严峻的合规壁垒与真实的用户体验需求,共同倒逼 AI 出海企业必须直面挑战,将算力基础设施本地化、区域化地部署在目标市场。针对这些痛点,PPIO 持续拓展算力资源,将算力集群覆盖至全球六大洲,致力于以优质的全球算力网络,全力支持中国企业的出海征程。此外,全球范围内的基础设施维护需要 7×24 小时的监控和支持,这对于出海企业的技术团队来说是一个巨大挑战。

2025-11-14 16:57:57 488

原创 当Agent计算规模扩大100倍,我们需要什么样的Agentic Infra?

沙箱克隆,如何助力解决Agent的“Scale up”?。沙箱克隆旨在助力提高 Agent 的并行计算能力,也就是经典的“Scale up”规模扩展问题。今年最流行的 Agent 产品是 Deep Research,它可以看作对单个研究问题持续追踪、推演、迭代直到形成洞察的长链路串行推理过程。那么,如果将 Deep Research 的能力 Scale up 一百倍会发生什么?

2025-11-12 11:58:02 927

原创 Trae下架Claude,但Vibe Coding之路才刚刚开始

今天,由字节跳动推出的智能编程助手 Trae 发布官方公告,由于服务中断,Trae 将不再提供 Claude 模型的访问权限。Trae 是一款非常受 AI 开发者欢迎的智能编程助手,具备完备的 IDE 功能,支持代码编写、项目管理、插件管理、源代码管理等功能。Trae 在 7 月发布的 SOLO 功能重塑了 Vibe Coding 的边界,只需 1 句提示词,就可实现从需求输入到部署交付的全流程自动化。

2025-11-07 18:53:16 1850

原创 PPIO上线Kimi K2 Thinking,兼容Anthropic协议

今天,PPIO 上线 Kimi K2 Thinking,这是 Kimi 最新、功能最强大的开源思考模型。Kimi K2 Thinking 基于 Kimi K2 后训练而来的混合专家模型(MoE),总参数达 1T,激活参数 32B,上下文长度 256K。该模型支持深度思考、Function Call、结构化输出、json_schema、json_object 等功能。现在,你可以到 PPIO 官网在线体现 Kimi K2 Thinking,也可以将 PPIO 的模型 API 部署到 AI 应用中。

2025-11-07 12:11:32 1250

原创 PPIO上新GPU实例模板,一键部署PaddleOCR-VL

今天,PPIO 上线 OCR 领域的 SOTA 模型——百度 PaddleOCR-VL。PaddleOCR-VL 是一款先进、高效的文档解析模型,专为文档中的元素识别设计。其核心组件为 PaddleOCR-VL-0.9B,这是一种紧凑而强大的视觉语言模型(VLM),它由 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型组成,能够实现精准的元素识别。

2025-11-03 11:00:14 975

原创 PPIO独家上新GPU实例模板,一键部署Kimi-Linear

昨晚,月之暗面发布了混合线性注意力架构新模型 Kimi-Linear,旨在解决大语言模型在长上下文推理中的计算瓶颈。Kimi-Linear 的核心亮点:Kimi Delta Attention(KDA),一种通过细粒度门控机制改进门控规则的线性注意力架构。混合架构:采用 3:1 的 KDA 与全局 MLA 比例,在保持甚至超越全注意力质量的同时降低内存占用。卓越性能:在 1.4T Token 的训练规模下,经公平对比,KDA 在长文本与类强化学习基准等多项任务上均优于全注意力。

2025-10-31 18:30:57 621

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除