vivo互联网技术-CSDN博客

原创 CVPR 2026 | 全新强化学习框架 BeautyGRPO：重塑真实人像

本工作提出全新强化学习框架BeautyGRPO。实验证明，BeautyGRPO 在真实场景的肌肤纹理重建与整体审美对齐上，全面超越了现有的专精修图方法与通用编辑大模型。

2026-06-18 18:08:57 320

原创从 Web 到桌面：基于 Tauri 2.0 + Vue 3 打造 vivo 线下门店「大头贴」拍照体验系统

本文介绍 vivo 线下门店「大头贴」拍照合成打印一体化桌面应用软件的技术方案。该项目基于 Tauri 2.0 + Rust + Vue 3 构建，实现了手机实时投屏、智能拍照、Live Photo 处理、模板合成、视频生成、跨平台打印等核心能力，为门店用户提供沉浸式拍照体验。

2026-06-18 16:58:37 360

原创 MagicWorld 实现长时交互视频世界建模

MagicWorld 针对当前视频世界模型在长时间交互中易出现运动不合理与场景崩坏的问题，提出了一种面向长时稳定性的交互式建模框架。该方法通过引入基于光流的运动约束提升动态真实性，利用历史检索机制增强跨时间一致性，并通过多步聚合的训练策略优化整体交互序列质量，从而有效缓解误差累积问题。整体上，MagicWorld 实现了在长时间交互下更加稳定、一致的世界生成能力。

2026-06-11 12:05:08 396

原创动效开发不踩坑：几种动效实现方案对比与实战选型

本文从 Android 渲染系统内核出发，系统拆解 Native、Lottie、PAG、SurfaceView、TextureView五种动效方案的底层原理，结合实战场景提供可落地的优化策略与选型体系

2026-06-11 11:14:48 189

原创 ICLR 2026 | LiveMoments 用参考图引导的扩散模型提升重选封面帧画质

我们团队提出了 LiveMoments，这是首个专门针对 Live Photo 重选封面帧画质修复的解决方案，已被 ICLR 2026 录用。针对用户重选封面时面临的画质降级痛点，我们利用 Live Photo 自带的原始高清封面作为参考，构建了一个包含运动对齐模块的参考引导扩散模型。该方法有效解决了两帧之间因时间偏移产生的运动错位问题，成功将低质的重选帧修复至高清水平，让用户捕捉的每一瞬间都能拥有“封面级”的清晰度与细节。

2026-06-04 14:28:10 368

原创把输入框变成 AI 的“超级入口”（ProseMirror 全流程实战）

最近在做知识库问答输入框的 @文档能力，表面上是“输入 @ 后选一个文档”的小需求，实操后发现核心难点在于编辑器稳定性。本文按真实心路历程展开：先讲最直觉的 DOM 方案与踩坑，再讲为什么转向 ProseMirror，并给出 @文档的落地实现。

2026-06-04 11:07:47 349

原创 AI 导购在 vivo 官网的落地实践

本文介绍AI导购技术在 vivo 官网 APP 的落地实践，通过定义解决问题的边界能力、搭建多层架构方案、方案落地这三大块内容逐步递进地展开 AI 导购在为用户服务的应用过程。

2026-05-28 11:13:47 448

原创 VAPD AgentKit：可组合 Agent 前端通用库实践

我们围绕三大业务场景（笔记、知识库、项目管理）统一了一套可组合的 AI Agent 能力。本文聚焦一期「Chat 模式」落地：强调 Runtime Adapter 的“协议无关、面向任意后端流”特性——只要后端能够以流式输出事件，前端即可通过统一的 Adapter 转为标准消息模型进行渲染与编排。我们以“统一消息模型 + Runtime Adapter + 前端编排”的方式，将工具调用、Agent 回合循环、事件流与 UI 交互组合在一起，并为后续历史与检查点能力预留 threadId/runId。

2026-05-21 12:53:13 508

原创 vivo 万台规模 YARN 集群升级实践

本文主要介绍了vivo大数据架构的演进历程中YARN服务的升级事项，从整体方案出发剖析每个环节遇到的问题难点并逐一分析讲解，对于研究调度器性能和从事大数据运维工作的同学具有较大的参考借鉴价值。

2026-05-14 10:50:12 419

原创下一代图片格式 AVIF 在 vivo 社区的落地实践

vivo社区在WebP已全面落地的基础上，引入下一代图片格式AVIF的实践经验。通过CDN边缘缓存+服务端异步转码的方案，在保证画质的前提下，图片体积相比WebP进一步降低20%+，有效提升用户体验。

2026-05-07 11:40:57 423

原创深度解析 vivo 活动系统全球化实践

本文聚焦 vivo 活动中台出海场景，提出“全球共线”架构方案。通过复用内销核心能力支撑外销业务，实现多语言、多时区统一管控，显著提升组件复用率并降低多地域维护成本。

2026-04-23 11:20:36 441

原创 OpenClaw 落地到生产实际应用的一种可能的路径

本文分析OpenClaw 要进入真实生产场景还欠缺的关键能力。笔者认为，要让 Agent 在业务世界稳定落地，必须把开放、分散、难回滚的执行环境，重构成一个可视化、相对封闭、可验证、可恢复的操作空间。

2026-04-16 10:49:36 429

原创从 OpenClaw 看 Agent 架构设计

本文通过对OpenClaw，Claude Code等主流Agent产品的设计进行分析，给出Agent架构设计的关键决策，分析各方案的利弊。

2026-04-09 20:13:10 422

原创 CVPR 2026 | C²FG：用分数差异分析提高条件生成中CFG的引导

CVPR 2026 | C²FG：用分数差异分析提高条件生成中CFG的引导

2026-04-02 17:08:55 430

原创 Nanobot（OpenClaw 轻量实现）的底层原理解析

本文以精简版 OpenClaw——Nanobot 为切入点，拆解其核心原理。其本质是基于循环执行的“提示词构建 + 调用大模型 + 工具操作”的本地 Agent 架构。通过分析消息处理、上下文构建、循环决策（AgentLoop）与工具调用（Tools）等流程，揭示其运行机制。

2026-04-02 11:34:29 512

原创营销自动化数据驱动 - 多源数据 OLAP 架构演进

本文基于营销自动化数据驱动场景，分析介绍了Presto+大宽表方案、Bitmap方案、StarRocks方案的架构演进。

2026-03-26 10:57:23 444

原创 ICLR2026 | Ada-RefSR: 自适应隐式相关建模，开启“信而有证”的参考超分新范式

针对于单步SD的超分模型容易出现幻觉问题，提出了信而有证参考超分新范式，基于单步扩散模型构建，首先通过注意力机制引入参考信息，随后通过隐式相关性建模进行过滤与验证。

2026-03-19 11:49:13 451

原创从业务开发视角聊聊可观测体系建设

本文探讨了分布式架构下可观测体系的建设实践，提出了基于业务视角的可观测体系建设框架：明确业务核心边界、建立指标体系（业务指标+SLO指标）、构建多维度观测（业务观测、链路观测、异常观测、变更观测）和固化排障路径，以游戏中心项目为例，介绍了项目在问题发现与问题定位上的实践，有效提升了问题发现与故障处理的效率。

2026-03-12 11:26:12 436

原创 Vibe Coding 之我们距离 “贾维斯” 还有多远

作者通过使用Vibe Coding和Claude Code等AI编程工具的实践经验，分享了与AI协作的方法和技巧。文章探讨了当前AI工具与理想中"贾维斯"智能助手的差距，包括缺少持续记忆、意图理解需反复对齐、决策点过于依赖人工等问题。作者提出了通过模板化常见场景、记录决策过程、优化沟通方式等方法来改进人机协作模式，并构想了一个包含记忆层、执行层、学习层的AI组织者系统，为实现更智能的人机协作提供了思路和方向。

2026-03-06 10:40:26 464

原创 ICLR2026 | 视频虚化新突破！Any-to-Bokeh 一键生成电影感连贯效果

针对视频散景制作常面临操作复杂、效果不自然等问题，难以满足创作者高效出片需求等问题，我们提出 Any-to-Bokeh 一键式视频虚化工具，对应的论文已被 ICLR2026 接收！该工具无需复杂操作无需专业操作即可生成电影感虚化效果。为短视频创作者、影视从业者提供了高效易用的创作工具，也为相关领域科研提供可参考的实践成果，助力 AI 视频编辑技术更贴近实用需求。项目代码与试用指南已公开至 GitHub，诚邀大家体验试用，欢迎 Star 支持并引用。

2026-03-05 14:41:47 481

原创深度解析悟空系统多机房部署共线改造

海外销量持续增长、业务运营诉求与日俱增，悟空作为一站式h5搭建平台，需要先发完成多地区化能力改造，基于复用、提效的思路，探索多地区系统方案，实现多地区一体化运作。

2026-02-26 14:30:49 299

原创游戏中心弱网优化实践

本实践围绕游戏中心在弱网环境下的性能优化展开，针对复杂网络场景下的页面加载慢、资源加载失败等问题，提出了优化方案：接入支持 QUIC 协议的 Cronet 网络库，通过更快的连接建立与传输特性提升请求响应速度。配合弱网状态精细化判定与限速测试，线上灰度实验显示页面加载失败率下降 40%，请求耗时降低 7%，图片加载速度在正常至极差网络环境均有显著提升。

2026-02-12 11:19:43 737

原创 Chat 模式是和 AI 最好的交互范式吗？

本文从实践出发，提出“意图信息密度匹配”是AI交互设计的核心。通过分析Chat模式与一键生成等案例，指出应依据用户意图的复杂程度，设计相应密度的交互方式，而非单一依赖某种范式。

2026-02-05 11:30:27 756

原创 vivo GPU容器与 AI 训练平台探索与实践

本文展示vivo GPU平台的总体架构，介绍容器平台在大规模GPU容器集群稳定性建设措施，以及探索多种GPU容器降本提效的解决方案。分享AI工程训练平台大规模训练稳定性建设，及GPU利用率提升实践经验。

2026-01-29 11:16:38 693

原创 vivo互联网全链路多版本环境落地实践

在软件研发过程中，“环境问题”是制约研发效能的关键瓶颈之一。环境不稳定、测试环境混乱、环境抢占严重等问题，显著影响开发与测试效率。本文系统介绍vivo通过“全链路多版本环境管理”模式，实现开发测试环境的快速构建与高效管理，使多版本环境能够像“平行宇宙”一般，实现安全、隔离、高效的并行测试与发布。

2026-01-22 15:43:01 721

原创 vivo 微服务架构实践之 Dubbo 性能优化

在Java技术栈场景，vivo主要基于 Apache Dubbo 框架来作为微服务之间的通信桥梁，在内部业务的大规模实践过程中，我们碰到了质量、性能和容量等方面的挑战，通过一系列的扩展与优化，较好的解决了相关问题，助力业务更好保障质量，节省算力成本，提升研发效率。

2026-01-15 10:54:11 745

原创智取流量，效赢增长-拨测和融合流量管理业务赋能实践

在飞速发展的互联网信息化时代下，抓住并充分利用“流量”将为业务增长带来“泼天”富贵，已成为共识。如何通过真实、海量的数据打造一个集成本、质量、效率于一体的融合流量管理平台，也成了各行各业的关注焦点，本文通过”拨测“与“融合流量管理”两个维度，来分享vivo在流量管理领域的一些实践和探索。

2026-01-08 10:55:40 788

原创数字人动画云端渲染方案

为优化拟我形象在多场景中的性能与接入，我们将其预先导出为视频/动图。通过对比，采用 Puppeteer + H5 渲染帧 + FFmpeg 合成方案，实现了效果一致、服务端批量处理与低成本接入，为规模化应用提供了可靠基础。

2025-12-18 10:40:16 806

原创 vivo Celeborn PB级Shuffle优化处理实践

vivo大数据平台通过引入RSS服务来满足混部集群中间结果（shuffle 数据）临时落盘需求,在综合对比后选择了Celeborn组件，并在后续的应用实践过程中不断优化完善，本文将分享vivo在Celeborn实际应用过程中对遇到问题的分析和解决方案，用于帮助读者对相似问题进行参考。

2025-12-11 10:33:06 943

原创从不足到精进：H5即开并行加载方案的演进之路

并行加载是 H5 即开 SDK 的加速技术，通过 native 层在用户打开页面时并行请求关键资源（如 index.html 和 CSR 模式 API），利用 webview 初始化时间窗口提前发起请求，减少加载耗时。其核心挑战是解决 webview 与并行任务间的资源交接问题。

2025-12-04 11:08:16 899

原创浅谈 AI 搜索前端打字机效果的实现方案演进

在当代前端开发领域，打字机效果作为一种极具创造力与吸引力的交互元素，被广泛运用于各类网站和应用程序中。本文力求以通俗的语言和严谨的思路，深入剖析打字机效果在不同阶段演进的关键技术难点和优劣势。

2025-11-27 11:09:08 1108

原创 Android动效探索：彻底弄清如何让你的视频更加酷炫

在Android移动端视频处理领域，除了基本的播放功能外，添加动画和滤镜等特效已经成为提升用户体验的重要手段。然而，很多开发人员可能对于实现这些功能所需的技术细节感到困惑。因此，本文旨在提供一个详细的指导，帮助开发人员掌握如何使用开源MediaPlayer或自定义播放器，并利用OpenGL ES来实现视频动画和滤镜效果。

2025-11-20 11:28:26 799

原创 Flink 的 RocksDB 状态后端在 vivo 的实践

本文简要介绍了特征拼接在实时推荐中的重要作用，并讲述了vivo实时推荐系统中特征拼接模块的架构演进过程以及采用现有的“基于RocksDB的大状态解决方案”的原因，重点叙述了该方案所遇到的一系列问题，并给出了这些问题的现象以及解决方案。

2025-11-13 11:10:53 1111

原创从0到1实现：AI版你画我猜小游戏

全民AI时代，前端er该如何蹭上这波热度？本文将一步步带大家了解前端应该如何结合端侧AI模型，实现一个AI版你画我猜小游戏。

2025-11-06 10:32:23 963

原创 Redis key 消失之谜

本文从一次生产环境业务服务报错，逐步对问题进行定位，深入分析之后发现导致问题的原因，给出相应的优化方法，提升业务可用性。

2025-10-30 10:47:05 998

原创 vivo 前端三剑客发展历程及原理揭秘

异地协作模式，给开发和测试间的问题沟通及定位带来了诸多挑战。本文从前端开发视角出发，阐述在这过程中遇到的痛点，探索解决的思路，并在过程中成功孵化出技术工具“前端三剑客”，文章深入解析了“前端三剑客”技术的实现原理及应用场景。

2025-10-23 10:29:04 1019

原创 vivo HDFS EC 大规模落地实践

EC编码能够对部分缺失的数据进行数据恢复，广泛应用于存储与通信领域。vivo目前HDFS集群节点达万台级别，数据规模接近EB级别，并且业务数据规模还在以较高速度持续增长中。在推进压缩算法缓解存储压力的同时，EC编码的推进是存储降本的一大有力手段。

2025-10-16 11:21:06 973

原创 vivo 浏览器福利体系架构演进之路

vivo浏览器为应对多场景金币激励需求及旧架构流量、IO等痛点，升级福利中心架构。服务层面拆分流量与业务，打造金币集散中心；数据层面分库分表、拆解大表并优化流水设计；通过仲裁系统和软事务保障数据一致性。改造后，系统可支撑千万级DAU，性能稳定提升，物理存储成本降低，解决了流量与存储压力，成为高可用可复制架构，且将持续迭代保持竞争力。

2025-09-25 11:45:13 977

原创拥抱新一代 Web 3D 引擎，Three.js 项目快速升级 Galacean 指南

本文从多个维度对比 Galacean 和 Three.js 两款Web3D 引擎的差异，并介绍拟我形象项目从Three.js 切换到 Galacean 以后带来的提升以及项目迁移的心得，为其他 Three.js 项目升级到 Galacean 提供参考。

2025-09-18 12:56:28 1164

原创聚焦结构化注意力，探索提升多模态大模型文档问答性能

本文聚焦多模态大语言模型（MLLMs）在文档问答（DocQA）任务中的性能提升，提出无需改动模型架构或额外训练的结构化输入方法，通过保留文档层次结构与空间关系（如标题、表格、图像位置）优化理解能力。研究发现，传统无结构OCR输入导致注意力分散，性能下降，而 LaTeX 范式结构化输入显著提升表现。注意力分析揭示其诱导“结构化注意力”，减少无关区域干扰，聚焦语义核心。在MMLongBench、PaperTab等四个数据集上验证，该方法尤其在复杂图表任务中效果显著，为智能文档处理与自动问答提供高效的解决方案。

2025-09-11 10:24:26 814

空空如也

空空如也