字节跳动开源-CSDN博客

原创你的 Agent 每次都“失忆”？这个工具彻底治好了我的前端开发焦虑

延续了超大字号、极重字重，大标题依然保持了原规范里的视觉冲击力；

2026-06-09 20:58:38 185

原创 Viking AI 搜索 CLI 正式发布：会说话，就能做搜索推荐

很多时候，问题不是没有数据，而是数据还没有真正被用起来。—— SearchCLI 的价值，就在于把已有数据从“放着” 变成 “用起来”，让原本分散在文件、表格和业务系统里的内容，真正具备可搜索、可推荐、可对话的智能能力。

2026-05-28 22:47:30 315

原创 veRL 推出开源 Uni-Agent：为通用 Agent 训练打造统一框架

Uni-Agent 是 veRL 开源团队提出的、为通用 Agent 打造的统一训练框架，其核心目标是构建一个贯通构建、运行与训练完整流程的系统。

2026-05-27 20:41:49 393

原创 ByteDance Research | 原生视频/图像生成理解编辑统一模型Lance发布，3B All-in-One Model助力学术开源生态

Lance 是 ByteDance Intelligent Creation Lab 推出的原生统一多模态模型，以 3B 激活参数和多任务协同训练，在单一原生统一框架中支持图像/视频理解、生成与编辑，兼顾资源效率、能力广度与跨任务泛化。基于 3B 激活参数量（总参数 6B），以及最大 128-GPU 训练预算下，Lance 在多个统一多模态基准上取得强性能：VBench 85.11、MVBench 62.0、GenEval 0.90、GEdit-Bench 7.30。

2026-05-27 11:42:41 405

原创局中局！给 Agent 装上 OpenViking，它们竟然学会了“记仇”和“伪装”？

作者｜字节跳动 Viking 团队GitHub｜从“单一 ChatBot”到“人与多 Agent 协同”，越来越多的系统开始将 Agent 组织起来，完成更复杂的任务。然而，缺少能够长期协同进化的记忆，协作起来像在经历“初恋 50 次”，它们记不住“谁在过去做了什么”，无法沉淀共同经验，更难在复杂博弈中形成“记仇”、“结盟”或“深度伪装”等高阶群体行为。这一次，OpenViking 将突破口放在了“让 Agent 彼此拥有可追溯的记忆”上：基于 OpenViking 为提供上下文管理。

2026-05-13 17:25:44 389

原创 OpenViking x OpenClaw：开箱即用解决 Agent 的长期记忆困局

但随着交互加深，一个普遍的“上下文管理困境”也随之浮现：Agent 常常遗忘之前交代过的信息，正如一些开发者在深入体验后指出的，尽管 OpenClaw 备受赞誉，但在长期使用中，“它完全忘记了我给它的API密钥”。的开源项目OpenViking ，已然成为社区热议的全新品类——面向AI Agent的上下文数据库，其核心价值正是为解决上下文工程中长期记忆的核心痛点而生，它并非要取代OpenClaw，而是作为其强大的“外挂记忆体”，提供跨应用、跨平台、跨智能体的通用记忆和上下文能力。

2026-03-17 18:52:26 602

原创 Rspress 2.0 发布：面向体验与 AI 的全新升级

基于 Rsbuild 的静态站点生成器，专为开发者打造的文档站工具！

2026-02-06 11:52:05 825

原创字节开源 OpenViking：面向 Agent 的上下文数据库

模型本身是通用的，大家越发意识到沉淀的记忆才是 Agent 的核心资产，但这不止包括使用用户的记忆，还包括 Agent 自身的经验和偏好记忆。：从 DeepSeek 和 Manus 的爆火能发现，在 AI 越来越强大时，用户更渴望白盒化的体验，能看到其思考与决策的轨迹。这种 “先锁定高分目录、再精细探索内容” 的策略，不仅能找到语义最匹配的片段，更能理解信息所在的完整语境，从而提升检索的全局性与准确性。无论是简单的问答机器人，还是复杂的自动化工作流，它都能作为坚实的上下文底座，提供稳定、高效的支撑。

2026-02-06 11:42:17 1005

原创 Midscene v1.0 发布 - 视觉驱动，UI 自动化体验跃迁

Midscene 自 2024 年开源发布以来，已经在 Github 斩获 11k star 、Trending 榜第二名等成绩，并在互联网、金融、政企、汽车等大量应用场景下完成落地。本月，我们正式宣布 Midscene v1.0 发布！

2025-12-29 17:15:29 1478

原创首届 Apache Gluten 社区年度盛会 —— GlutenCon 2025 正式启动！

在这个数据爆炸的时代，如何让 Spark 等计算引擎跑得更快？如何通过原生向量化执行突破性能瓶颈？2025 年 12 月 6 日（周六），首届 Apache Gluten 社区年度盛会 —— GlutenCon 2025 将于北京举办。来自字节跳动、IBM、微软、腾讯、华为、小红书、小米、BIGO 等企业的技术专家将带来硬核技术分享，带你深入了解 Bolt 加速库、GPU 优化、内存管理等核心议题。

2025-12-04 11:59:53 422

原创 AIBrix v0.5.0 正式发布：实现批量API支持、KVCache v1连接器升级，全面提升P/D架构协同效能

今日，我们正式发布 AIBrix v0.5.0。此版本引入与 OpenAI 兼容的批处理 API，专为处理高吞吐、时延不敏感的离线推理与评估任务设计，有效避免对实时端点造成干扰。同时，新版本集成了全新的 KVCache 连接器（AIBrixOffloadingConnectorV1Type3），借助其流水线式预取与分层卸载机制，显著提升 KVCache 卸载与复用的效率。

2025-11-25 13:44:04 1474 1

原创开源可信MCP，AICC机密计算新升级！

火山引擎 AICC 机密计算迎来新升级，发布支持 MCP 的可信方案——Trusted MCP，并正式开源该组件。开发者和企业可通过该功能实现 MCP 核心组件及组件间的通信数据安全，有效解决 MCP 应用过程中的数据泄露和身份验证等风险。

2025-10-31 14:29:14 1014

原创 AIO Sandbox：为 AI Agent 打造的一体化、可定制的沙箱环境

AIO Sandbox 通过一个 Docker 镜像整合所有能力，提供统一文件系统与鉴权，并支持镜像定制，提升了 Agent 任务执行与交付效率。

2025-10-31 11:27:44 1687

原创 AI 体验走查 - 火山引擎存储的 AI UX 探索之路

火山引擎存储技术团队驱动 AI 自主完成用户体验走查 / 可用性测试的执行与评价，帮助业务改善交互体验。立项“故事走查”的背景诉求和 AI 机遇如何搭建“AI 评价”能力，精准识别交互问题让交互体验故事走查变为技术产品，讲解系统设计，包括流程、User Story 维护、框架和 AI 模型选型、Midscene.js 的集成技巧等

2025-07-04 14:45:28 2756

原创抖音内容技术团队开源ContentV：有限算力下高效训练视频生成模型的新路径

抖音内容技术团队开源了 ContentV，一种面向视频生成任务的高效训练方案。该方案在多项技术优化的基础上，使用 256 块显卡，在约 4 周内完成了一个 8B 参数模型的训练。尽管资源有限，ContentV 在多个评估维度上取得了与现有主流方案相近的生成效果。该工作探索了在有限算力条件下训练视频生成模型的可行路径。目前，推理代码与模型权重已对外开放。

2025-07-03 14:30:37 1191

原创 NeurIPS 2024|统一的多模态文字理解与生成大模型

本文介绍NeurIPS 2024录用论文“Harmonizing Visual Text Comprehension and Generation”的主要工作。这篇文章提出了首个OCR领域的大一统多模态文字理解与生成大模型，即TextHarmony。TextHarmony不仅精通视觉文本的感知（文字检测识别等）、理解（KIE、VQA等）和生成（视觉文字生成、编辑、抹除等），而且在单一模型中实现了视觉与语言模态生成的和谐统一。

2025-06-17 10:48:21 990

原创 Gödel Rescheduler：适用于云原生系统的全局最优重调度框架

字节跳动研发了 Gödel Rescheduler——一个适用于全局最优调度策略的重调度框架。它不仅能识别集群中的异常节点和任务，还能智能推荐任务到最合适的位置，并通过图算法生成详细的迁移步骤，确保集群的整体稳定性，真正实现全局最优调度。

2025-06-16 11:37:33 1247

原创基于 MCP 的 AI Agent 应用开发实践

最近大家都在聊 MCP，发现有个最重要的点被忽略了『通过标准化协议，将工具提供方与应用研发者解耦』，这一点带来的将是 AI Agent 应用研发范式的转移（类似 Web 应用研发的前后端分离）。本文以开发 Agent TARS 应用为例，尽可能详细地介绍 MCP 在『开发范式』、『工具生态扩展』上起到的作用。

2025-04-25 15:03:18 1256

原创字节跳动开源 Godel-Rescheduler：适用于云原生系统的全局最优重调度框架

字节跳动研发了 Godel-Rescheduler，一个基于全局最优调度策略的重调度框架。它不仅能识别集群中的异常节点和任务，还能智能推荐任务到最合适的位置，并通过图算法生成详细的迁移步骤，确保集群的整体稳定性，真正实现全局最优调度。

2025-04-15 17:10:25 1077

原创是时候正视开源合规的重要性了！我们给你准备了一套体系课程

为了帮助大家系统了解开源软件的合规知识，字节跳动开源团队及知识产权法务团队将推出开源合规精选培训课程，4月24日 19:00-19:30即将开启第一课，自5月8日起，将连续 5 周在周四晚上19:00-19:30进行直播分享。

2025-04-03 12:00:00 413

原创基于控制面单元化的 Kubernetes 集群联邦

字节跳动在云原生技术架构设计中构建了统一的云原生基础设施平台。其中，上层平台层直接对接Kubernetes集群资源，并基于 Kubernetes 原生 API 标准，通过大规模集群联邦模式实现多集群的统一接入与管理。目前，集群联邦已经覆盖了字节跳动90%以上的资源，节点数超过21万，管理超10万在线微服务与1000万Pod，是目前业界规模最大的生产级集群联邦应用。

2025-04-02 14:16:58 826

原创基于控制面单元化的 Kubernetes 集群联邦

字节跳动在云原生技术架构设计中构建了统一的云原生基础设施平台。其中，上层平台层直接对接Kubernetes集群资源，并基于 Kubernetes 原生 API 标准，通过大规模集群联邦模式实现多集群的统一接入与管理。目前，集群联邦已经覆盖了字节跳动90%以上的资源，节点数超过21万，管理超10万在线微服务与1000万Pod，是目前业界规模最大的生产级集群联邦应用。

2025-04-02 14:13:51 1106

原创 MySQL遇到AI：字节跳动开源 MySQL 虚拟索引 VIDEX

虚拟索引技术在数据库系统的查询优化、索引推荐等场景中扮演着关键角色。简单来说，虚拟索引可以理解为数据库的'沙盘推演'系统——无需真实构建索引，仅基于统计信息即可精准模拟不同索引方案对查询计划的优化效果。由于虚拟索引的创建/删除代价极低，使用者可以大量创建和删除索引、反复推演，确定最有效的索引方案。在AI时代，基于机器学习模型的NDV、Cardinality 估计算法层出不穷，但是在MySQL落地往往遇到很大挑战：无法在MySQL生成查询计划时注入机器学习模型的预测值，优化器便难以给出更合适的索引推荐结果。

2025-03-28 12:00:30 1335

原创 Midscene.js：AI 在前端测试领域的应用

Midscene.js 是由字节跳动 Web Infra 团队全新开源的 UI 自动化工具。通过引入多模态 AI 推理能力，Midscene.js 将帮助开发者打破传统 UI 自动化难于编写和维护的困境。

2025-03-20 15:43:43 2619

原创深度解析：通过 AIBrix 多节点部署 DeepSeek-R1 671B 模型

本文详细介绍了如何通过 AIBrix 分布式推理平台实现 DeepSeek-R1 671B 的多节点部署。

2025-03-18 14:40:52 1388

原创 FlowGram 简介：开源前端流程搭建引擎

FlowGram 是一套基于节点编辑的流程搭建引擎，帮助开发者快速创建固定布局或自由连线布局的流程，并提供一套交互的最佳实践, 很适合有明确输入和输出的可视化工作流。

2025-03-17 12:06:02 6375

原创 vArmor：云原生容器安全的多场景应用实践

特权容器通常指包含设置的容器，此类容器被授予全部 capabilities，可访问宿主机所有设备和内核接口。本文将所有拥有打破隔离性配置的容器称为 “特权容器”，包括但不限于 privileged container、sensitive capabilities、sensitive mounts、shared namespaces、sensitive RBAC permissions。许多企业因历史遗留问题、系统设计需求、安全意识不足等原因，在生产环境的业务负载和系统组件中引入了 “特权容器”。

2025-03-10 16:06:03 1429

原创 AIBrix 深度解读：字节跳动大模型推理的云原生实践

随着 LLaMA、DeepSeek、Qwen 等开源大模型的快速崛起，企业在模型部署的灵活性、成本与自主可控性方面迎来了新的机遇。然而，仅靠对模型本身的优化尚不足以将这些模型部署成高效且可扩展的生产级 API。大模型推理往往引入诸多独特的系统挑战，如 GPU 弹性伸缩指标的非线性问题，长尾模型和精调模型流量过低的问题，多机推理时的角色编排以及 GPU 卡型的异构管理等，都对易用性和成本控制提出了更高要求。

2025-03-10 11:36:59 2237

原创 2025 年，微服务架构和大模型能 “玩出” 什么新花样？

3 月 22 日，以《云原生 × AI 时代的微服务架构与技术实践》为主题的 CloudWeGo 技术沙龙将在深圳科技园希尔顿惠庭酒店正式启幕。本次活动汇聚了多位来自字节跳动、火山引擎、智谱 AI 的技术大咖，共同探讨云原生与 AI 技术融合趋势下，微服务架构的演进方向与最佳实践。

2025-02-26 15:53:52 823

原创 AIBrix: 专为 vLLM 打造的可扩展、高性价比控制面

2025年2月21日，vLLM通过官方博客宣布了由字节跳动开发的AIBrix大模型推理系统开源，为vLLM推理引擎提供可扩展且高性价比的控制面。开源72 小时内，AIBrix 收获的GitHub Star 数已超 1000, 96 小时突破2000, 截止本文发布保持着榜第一的位置。

2025-02-26 15:53:40 2440

原创大语言模型应用开发框架 —— Eino 正式开源！

在组件定义和通用基座能力的基础上，我们认为，大模型应用开发存在相对固定的数据流转和流程编排范式：以 ChatModel（大模型）为核心，通过 ChatTemplate 注入用户输入和系统 prompt，通过 Retriever、Document Loader & Transformer 等注入上下文，经过 ChatModel 生成，输出 Tool Call 并执行，或输出最终结果。在明确的组件定义基础之上，我们认为，大模型应用开发存在通用的基座性质的能力，包括但不限于：处理模型输出的流式编程能力；

2025-01-22 15:53:25 1747

原创 ICLR 2025 Workshop 征稿：推动基础模型的开源、开放、可复现

Open Foundation Models：预训练策略，包括数据扩展、模型架构、多模态和多任务预训练。学习算法，如元学习、模型融合、模型合并和为开放、可扩展模型设计的持续学习。Open Replication of Proprietary Systems：复现专有的基础模型和系统，确保更广泛的研究和开发的透明度和可重复性。Open Compute Efficiency Techniques：专注于模型蒸馏、压缩、量化和优化注意力或内存机制，以提高基础模型的计算效率。2025 年 2 月 10 日。

2025-01-22 14:08:44 2164

原创豆包 MarsCode + 开源 = ？AI 助力开源社区新人成长

使用豆包MarsCode 学习开源项目

2025-01-22 13:57:02 1840

原创数据处理不再是“脏活累活”，听听开发者们怎么说？

本次活动也收集到了不少来自开发者的改进建议，ByConity 社区将根据这些反馈持续优化产品功能，构建一个更加活跃的开源生态。

2025-01-02 15:48:31 424

原创首次覆盖超 11 类真实编程场景！豆包大模型团队开源代码大模型全新基准

字节跳动豆包大模型团队开源 FullStack Bench，一个专注于全栈编程和多语言编程的代码评估数据集。FullStack Bench 能够真实反映大模型在多种实际代码开发场景中的表现，有助于推动代码智能领域的进一步发展。

2024-12-06 18:16:30 1697

原创 Kitex/Hertz 助力大模型：三周年重要特性回顾｜CloudWeGo

本文根据 CloudWeGo 三周年《Kitex/Hertz 助力大模型：三周年重要特性回顾》分享整理，介绍近一年来 Kitex/Hertz 的重要特性，希望为企业用户、社区同学在自己的项目中更好的应用 Kitex/Hertz 构建自己的微服务体系提供帮助。

2024-12-06 15:24:33 1261

原创大幅降低数据科学门槛！豆包大模型团队开源AutoKaggle，端到端解决数据处理

字节跳动豆包大模型团队与 M-A-P 社区于近日提出 AutoKaggle ，为数据科学家提供了一个端到端的数据处理解决方案，帮助简化和优化日常数据科学工作流程的同时，极大降低数据科学的门槛，可帮助更多没有相关背景的使用者进行有价值的探索。最后，我们统计了不同错误类型及出现次数，可以看到，每个子任务阶段都有可能发生错误。未来，团队成员还将继续探索智数据科学课题及相关开源工作，并关注 Kaggle 上的最新前沿技术，如果你也对智能体协作、数据科学、大模型对复杂问题的解决感兴趣，有志于探索前沿课题，

2024-11-29 18:29:45 1314

原创无文本编码器仍能媲美CLIP！豆包大模型团队首创SuperClass模型

实验结果表明，SuperClass 在各种纯视觉场景和视觉 - 语言多模态场景下均优于 CLIP，同时基于分类的方法，模型展现出与 CLIP 相当，甚至更优的 Scalability。为了更好度量预训练得到的视觉表征能力，我们固定住训练好的视觉模型的参数，将其应用到 Linear probing、zero-shot、10-shot 等分类任务，同时接入到 LLM 做视觉和语言多模态下游任务进行评测。CLIP 广泛应用的另一个场景是多模态理解，作为多模态大模型中的视觉编码器，展现了很好的跨模态能力。

2024-11-29 18:17:33 1165 1

原创最高提升20倍吞吐量！豆包大模型团队发布全新 RLHF 框架，现已开源！

然而，控制流和计算流高度耦合，当设计新的 RL 算法，组合相同的计算流和不同的控制流时，需要重写计算流代码，修改所有相关模型，增加了开发难度。基于 Ray 的分布式编程，动态计算图，异构调度能力，通过封装单模型的分布式计算、统一模型间的数据切分，以及支持异步 RL 控制流，HybridFlow 能够高效地实现和执行各种 RL 算法，复用计算模块和支持不同的模型部署方式，大大提升了系统的灵活性和开发效率。这种灵活的模型部署方式，满足了不同算法、模型和硬件环境下的资源和性能需求。

2024-11-12 18:11:07 1633

原创开源三年，CloudWeGo 的生态发展和社区增长

对于 Hertz 来说，在社区开发者的大力支持和参与下，同样构建了丰富的周边生态，在服务注册发现以及可观测性方面，和 Kitex 的能力集成体验上几乎是一致的，技术栈可以保持统一。微服务架构下，随着业务的发展，对服务的管控难度会越来越大，服务治理的作用就是为了解决服务拆分所引发的一系列问题，以让服务更稳定地运行，涉及的主题包含了服务注册与发现、负载均衡、服务熔断、服务降级、服务限流等。首先，Bookinfo 是 Istio 官方提供的经典 demo 应用，它的目的是演示 Istio 的各种各样特性。

2024-11-12 17:53:29 1256

空空如也

空空如也