阿里巴巴淘系技术团队官网博客-CSDN博客

原创淘系技术，实力为2019年双11而战！稳！

今年，双11走到了第11个年头，史无前例的，阿里经济体内有49支技术团队共同参与作战，也是第一次，双11的核心系统将100%跑在云上，这无疑让今年的双11技术作战充满了更大的挑战。正如2019年双11技术团长平畴（汤兴）说的“「善战者，无智名，无勇功」，这是我们技术人最高的境界”。我们一起捍卫了阿里技术人的荣耀，一个字 “稳”！年年双11，回回新玩法，“在吗，盖楼吗？”成为了好友聊天的日常，每天蹲...

2019-11-12 00:38:06 22934 7

原创 TLiveOmni 1.0: 直播视频多模态理解大模型

TLiveOmni 1.0是一款面向电商直播场景的全模态大模型，原生支持图像、文本、视频、音频四模态统一输入，实现128K上下文窗口。该模型深度扎根电商直播领域，构建了超20项精细化原子能力，包括音频维度的语境感知ASR与多说话人分离、视频维度的商品时序切分与卖点提取、以及图像维度的商品空间定位与细粒度OCR。基于Qwen3-VL-Instruct架构，通过添加音频编码器并采用"模态对齐→能力强化→全任务微调"三阶段训练范式，模型在电商直播场景的关键任务上达到SOTA水平。在推理部署方面，通过定制化vLLM

2026-05-20 16:26:21 404

原创 RAG 全链路技术详解

因此，我们梳理了这篇技术指南，期望从实战角度拆解RAG的全链路核心能力：从底层原理出发，深入探讨如何构建索引、如何通过技术手段优化召回，以及如何建立科学的评测闭环。大型语言模型（LLMs）已经取得了显著的成就，尽管它们仍然面临着很大的局限性，尤其是在特定领域或知识密集型任务中，特别是在处理超出其训练数据或需要当前信息的查询时，会产生 "幻觉"。其中，X是与位置相关的矩阵。应用会将问题与文本段通过提示词模板生成最终的提示词，由大模型生成回复，这个阶段更多是利用大模型的总结能力，而不是大模型本身具有的知识。

2026-05-18 17:36:50 481

原创面向智能导购的Agent评测实践

一支专注于通过 AI 和 3D 技术驱动商业创新的技术团队，依托大淘宝丰富的业务形态和海量的用户、数据，致力于为消费者提供创新的场景化导购体验，为商家提供高效的场景化内容创作工具，为淘宝打造围绕家的场景的第一消费入口。在数据集构建完成后，我们使用四种搭配模型生成最终的搭配结果，分别为：外部模型XX、gemini25（gemini-2.5-pro-06-17）、gpt51（gpt-51-1113-global）、qwen3-vl（qwen3-vl-235b-a22b-instruct）。

2026-05-15 16:56:59 575

原创 AI-Generated UI 技术深度解析：模型流式输出与 UI 渲染实践

团队聚焦AI原生及衍生技术的探索与落地，覆盖从问题定义、方案设计、模型选型与训练微调，到工程交付与效果迭代的全链路闭环，致力于通过系统架构、平台能力、上下文工程及评测体系，沉淀可复用的技术资产与能力底座，高效支撑业务的探索与持续发展。从高并发C端交互到AI驱动的B端解决方案，从架构性能优化到算法模型落地，持续挑战系统边界，以技术重构商家经营效率，定义下一代智慧零售新标准。随着模型能力的持续提升和工具链的不断完善，AI-Generated UI 将从"辅助工具"进化为"创作伙伴"，深刻改变软件开发的方式。

2026-05-13 16:22:08 313

原创缓存使用实践总结：以淘宝交易结算场景为例

CAE代扣协议签约信息：支付宝向集团侧提供了CAE代扣的结算能力，CAE代扣的前提是商家签约了CAE代扣协议，而CAE代扣协议的签约信息是落在支付宝侧，但汇金侧会在每次销帐调支付宝CAE代扣时快照存储一份CAE代扣签约信息。A1：缓存会占用内存空间，而单个应用机器的内存是有限且难以动态扩展的，如果数据量过大使用本地缓存可能会导致OOM，若限制了缓存空间的上限则可能导致淘汰频繁从而缓存命中率过低，而分布式缓存的空间是可横向动态扩展从而满足大数据量的需求。1、对于旁路与直写缓存，确保代码能准确重刷缓存；

2026-05-11 16:29:07 604

原创天猫新品团队AI编码实战指南（下）

虽然对于枚举过的页面，现有的约束条件可以一定程度上约束产出内容，但是对于未枚举，或者无法枚举的页面，产出的页面就随着使用者或者编码工具的不同而开始天差地别，（有时候甚至可以通过页面风格判断是谁，用什么工具写的页面）有什么办法可以让这些部分也尽可能地有一个较为一致的视觉表现？所以，我们为小二端开发提供了一个轻量级的团队知识库（其实更多用在C端开发），以类Skill的形式封装了小二端开发的规范与代码模版，实现了无视开发工具，简单易用的公共知识库，通过公共知识库进行小二端 AI 开发的。请翻译：‘今天天气真好。

2026-05-08 16:07:48 565

原创天猫新品营销技术团队AI编码实战指南（上）

完成需求后，可以重新梳理整个流程中的问题与可以复用的内容，进一步完成资产沉淀，这部分内容前期的生成和调整都会比较费劲，但是基本几个中型需求认真跑下来的沉淀，就可以覆盖很多日常开发的内容了，然后就可以逐步进入坐享其成的阶段。基于以上思路，还可以进一步设计视图分离的组件库，预设组件的事件，由调用方进行视觉组件的实现，完成事件的绑定，做到最大化的逻辑复用。重构过程中，也经常会遇到视图和逻辑绑定过深，无法复用视觉/逻辑代码的情况，这时候也可以直接让 AI 进行代码拆解，产出更加纯粹的逻辑/视觉组件。

2026-05-06 17:42:52 377

原创面向电商直播场景的全模态大模型推理加速方案

最终在H20与RTX 4090硬件上的实测表明，该方案在保证各模态任务精度损失控制在1.5%以内的前提下，实现了2.5倍至3.5倍的推理加速，且针对不同硬件特性总结出了FP8（H20）与W4A16（4090）的最优部署策略。然而，随着多模态大模型（VLM）的快速发展，引入了视觉、音频等多模态数据，这对整个大模型的推理系统是一个新的挑战。包括音频维度的语境感知ASR与多说话人分离，视频维度的商品时序切分与直播卖点提取，以及图像维度的商品空间定位与细粒度OCR，实现了对直播内容的全面解构。

2026-04-29 16:17:38 688

原创淘天营销中后台生码工作流最佳实践

集团内的luna资产中心可以解决这类问题，但由于营销中后台公共组件、utils较多，全量迁移至luna成本较高，因此先通过一个资产使用指引Skill来包装各种资产的查询方式，内部调用各个平台（luna、codewiki、anpm）的开放接口，但实际执行过程中发现Agent的指令遵循度较差，常常弄错当前npm包应该调用哪个开放接口获取。淘天集团-营销前台技术团队。从更长远的视角看，随着 AI 能力的持续升级和私域知识库的不断沉淀，营销中后台的AI生码路径将朝着更高自动化程度、更低人工干预成本的方向持续演进。

2026-04-27 16:16:18 659

原创 800行代码实现 Open Claw 的 Tool、消息总线、子Agent管理架构

本文想说明的技术观点是对于 Tool 调用、消息分发、子 Agent 管理这三类 Agent 系统里的核心组件，优先采用薄抽象、显式控制流和贴近模型 API 的实现方式，往往比引入多层中间件更容易获得工程上的确定性。系统边界更清晰，运行路径更容易追踪，问题更容易定位，也更适合作为后续扩展 Memory、调度和持久化能力的基础。业务上，我们负责 88VIP、天猫积分、省钱卡、大会员、消费券等淘宝核心业务，同时支撑淘宝、千问、闪购等阿里业务的账号互联互通。用运行时普通对象定义，而非 Zod 等库。

2026-04-24 16:29:52 529

原创 MNN-Sana-Edit-V2：端侧运行的图像漫画风编辑大模型

MNN-Sana-Edit-V2 是淘宝业务技术 Meta 团队联合杭州电子科技大学研发的端侧图像编辑大模型，该模型在参考 Sana 和 Metaquery 等学术界论文的基础上，基于文生图框架，创新性地增加了图像编辑功能，基于淘宝 MNN LLM 和 MNN Diffusion 的端侧量化部署能力，做到了所有模型本地运行，既能保护隐私，避免用户信息泄漏，又能做到快速运行，减少等待时间。具体来说，对预训练的 LLM 模型权重，我们采用了 4Bit 非对称量化，别的模型均采用 8Bit 非对称量化。

2026-04-22 17:02:25 764

原创 Codeindex · 让大模型更好地理解你的代码

针对代码量大、分支多及依赖关系复杂等痛点，Codeindex 提供了代码语义化索引、检索以及函数依赖图生成能力。团队以前端、Weex、Native端的技术解决方案框架和研发模式不断完善自己，持续探索端智能等创新，打造极致的体验和工程技术，保障多端设备的适配和稳定运行，致力于让亿级规模的交付能够更丝滑、更稳定。总结一下上面的时序图，SDK 内部会查询文件内部声明了哪些函数、函数内部有没有嵌套声明函数、函数内部调用了哪些函数、被调用的函数是来自内部声明还是外部引用。对 Class 内部的函。

2026-04-20 17:13:41 806

原创卡片式对话的协议方案探索和思考

最终，文章提出了一套包含Markdown标记、消息传输、UI渲染及事件通信的四层统一协议体系，旨在解决Agent时代下多端一致性、数据实时性及跨团队协作混乱的问题，为构建高效、标准化的卡片式对话系统提供了落地的架构参考。一种可行的组合方式是：在 MCP Tool 层使用 MCP Apps 的绑定机制来管理 Tool 与 UI 的映射关系，同时用 A2UI 的 JSON Schema 作为 UI 描述的标准格式——这样既有 Tool 层的确定性，又有 UI 层的通用性。这种"自由"的代价是系统迅速碎片化。

2026-04-17 16:01:30 432

原创淘宝动效解决方案分享

进一步看，动效体系的演进不应只是播放器或渲染技术的优化，更应是覆盖全链路的系统化升级，而AI将在其中发挥越来越重要的作用。本文提出了一套平台化、协议化、工程化的动效解决方案，覆盖设计（AE插件）、编辑（可视化画布SDK）、布局（align/group动态对齐与成组）、播放（H5/Weex跨端统一Player）、压缩（二进制优化）、代码生成（Lottie→Anime.js）及AI辅助（MCP协议动效Agent）全链路，解决碎片化、多端不一致、性能差、维护难等痛点，实现“一次制作、多端复用、智能可控”。

2026-04-15 16:37:40 667

原创从全量启动到最小核：手淘外链唤端链路的三次架构演进

对用户来说，体感最差的不只是"慢"，还有"乱"——闪屏页长时间停留制造焦虑，首页闪现又消失让人困惑，目标页面的白屏等待更是将耐心消磨殆尽。但我们观察到，在启动任务执行期间，网络 I/O 能力几乎完全空闲——启动任务主要消耗的是 CPU，而资源加载主要消耗的是网络带宽，两者天然适合并行。通过不断的探索和沉淀，我们的外链唤端架构经历了从全量串行到按需裁剪、从被动等待到主动预加载的演进过程，先后落地了标准链路、极简链路和最小核链路三代方案，最终将低端设备的唤端体感耗时从 10s 压缩到 3s。

2026-04-14 16:21:04 612

原创 AI 答疑助手优化实践：从 RAG 到 LightRAG 的全链路升级

在全局性问题上，LightRAG 的高级检索虽然不如 GraphRAG 的 Global Search 那样有社区摘要的加持，但在我们的场景中已经足够用了——毕竟用户问的 80% 以上都是具体的技术问题，而非需要鸟瞰全局的综合性提问。当用户问"WebView 的离线包加载流程是什么"时，系统首先通过向量相似度找到 "WebView" 和 "离线包" 相关的实体节点，然后提取这些节点的 Value 文本以及它们之间的关系描述，拼装为上下文。根据上一步推理出的每个步骤，分别生成对应的知识库查询关键词组。

2026-04-10 16:35:51 765

转载告别“伪智能”代码：用 Spec + RAG 打造真正懂你的AI程序员

文章指出，单纯依赖大模型的自然语言理解往往导致代码生成不准确，而通过引入结构化的开发规范（Spec）作为明确指令，并配合RAG技术实时检索项目特有的代码库、文档和最佳实践，可以赋予AI真正的“项目感知力”。这种模式让AI从通用的代码生成器转变为懂业务、懂架构的专属程序员，显著提升了代码生成的准确性、可维护性及与现有系统的融合度，为构建高质量、低幻觉的AI辅助开发流程提供了切实可行的落地方案。（Specification，规范）是对软件系统行为、接口、数据格式或业务规则的精确、无歧义、可验证的描述。

2026-04-08 16:06:36 165

原创淘宝跨端体验优化 AI 演进之路

在AI重塑终端体验与研发范式的浪潮中，我们正驱动终端智能化创新、构建AI赋能的研发新基建，寻找兼具工程深度与AI思维的伙伴共同定义下一代终端体验。通过知识萃取（文档、群聊、问题排查记录）等进行统一的解决方案&规则驱动沉淀，同时通过思维链学习，让体验优化 Agent 成为每个跨端同学最懂手淘体验的 AI 架构师。决 JSE 问题的采集、问题挖掘、代码修改的负向问题解决闭环。此时的 AI 基可以完成全托管独立完成采集到分析到修改的全链路体验优化了，也是目前所处的阶段，需要做的是进一步提升评测的分数跟准确性。

2026-04-03 17:16:23 650

原创淘宝营销会场智能测试平台的AI落地实践

LLM、多模态、Agent在会场领域测试专项中落地通过串联复杂工具，多模态判断起到一定效果，但实际需求测试环节中需求理解、数据构造、测试用例识别（测试内容选择）上更多靠人工辅助判断。会场测试在“所见所得渲染验证、价格一致性、Tab/Feed 交互、骨架/快照/终态对比、渠道投放一致性、内容异常发现”等多个维度，传统依赖人工肉眼和脚本、难以覆盖且易遗漏。在AIGC技术爆发、市场剧烈波动、技术栈快速迭代、模型架构多样化的行业背景下，我们在会场AI模型的业务会场测试中进行了一些探索。

2026-04-01 17:21:02 708 1

原创从 Vibe Coding 到范式编程：用 Spec 打造淘系交易的 AI 领域专家

本文介绍了从“Vibe Coding”向“范式编程”演进的技术路径，核心是通过结构化规范（Spec）驱动AI生成符合企业级标准的代码。文章以淘系交易系统为背景，指出当前AI编程工具因缺乏领域知识、上下文缺失和规范约束，导致生成代码不可靠、难维护；为此提出“范式编程”——将规范置于开发中心，结合知识库、知识点、疑问点机制与AI Agent，构建可沉淀、可复用、可演进的AI领域专家体系，实现从“人写代码”到“人机协同”的范式升级。前言凌晨两点，⼩丫同学盯着屏幕上Cursor⽣成的代码，第三次按下了删除键....

2026-03-30 15:37:43 1253

原创 97.9%采纳率，胶水编程：业务需求出码最佳实践【天猫AI Coding实践系列】

这是一个典型的中后台业务需求，涉及列表、详情、状态机，复杂度适中但细节不少。它们的独立性体现在——答对任何一个，不保证其他三个也对：Agent 可以理解需求但违反了团队禁用某依赖的规矩（缺开发规范），可以守规矩但文件组织混乱（缺代码模式），可以结构规整但踩了内部组件的坑（缺领域知识）。中后台需求虽然千变万化，但复杂度的来源是可枚举的：交互表达（非标布局、多弹窗）、数据逻辑（字段联动、状态流转）、后端对接（接口契约、嵌套结构）、业务规则（跨字段校验、计算逻辑）、异常处理（空状态、超时重试）。

2026-03-27 16:51:12 1041

原创拒绝“感觉有效”：用数据证明 AI Coding 的真实团队价值【天猫AI Coding实践系列】

通常是最后一次提交的 commit。由于存在多对多关系（一个 Task 可能关联多个需求），各维度的汇总值不等于实际总消耗，但这种设计更符合业务分析的需要——产品经理关心的是「这个需求花了多少 Token」，而不是「这个 Token 被几个需求共享」。业界有通用的评测基准（如 SWE-bench），但通用基准解决不了具体团队的问题——以我们的中后台前端场景为例，存在多解性（同一需求有多种等价实现）、测试成本高（交互类需求难以自动化验证）、过程盲区（只看结果不看 Agent 是否查阅了正确资料）等核心差异。

2026-03-25 15:45:45 866

原创知识基座：让“AI 越用越懂业务”的团队经验实践【天猫AI Coding实践系列】

该基座不仅让AI在代码生成、Bug修复和需求分析中能精准理解业务上下文，减少幻觉，还通过持续反馈机制实现知识的动态迭代，使AI随着团队使用不断“进化”，最终成为真正懂业务、能落地的智能研发伙伴，显著提升团队整体效能。内部知识存储按业务域进行物理隔离（通用、某跨境电商、业务域 A、业务域 D、业务域 C、业务域 B 等），确保各业务线知识独立管理。当前已实现的 V1 指标包括：召回率（有结果查询占比）、零结果率（无结果查询占比）、平均返回数（每次查询返回条数）、知识召回次数（单条知识被引用频次）。

2026-03-23 15:39:54 725

原创 AI Coding前端实践后的复盘总结

通过实践，团队提炼出“人机协同”的最佳工作流：将AI定位为高效助手而非替代者，强调通过优化提示词（Prompt）、建立前端专属知识库及制定严格的代码审查规范来弥补AI的不足，最终实现研发质量与速度的双重提升，为前端团队规模化引入AI辅助开发提供了可复制的方法论。不需要懂高深的AI原理，只要掌握这些技巧，每个人都能成为AI Coding的高效使用者。由于没有指定Agent使用相同组件，而是使用模糊的“保持一致”的描述,导致生成的代码仅仅是模仿了参考组件的样式，不仅生成的页面样式不够还原，Agent还会。

2026-03-18 17:20:20 895

原创软件为何越做越乱？万字长文讲透软件的“复杂性”

本文通过一个电商系统“限时折扣”功能从快速上线到逐渐演变为复杂黑箱的典型案例，深入剖析了软件系统为何越做越乱的根本原因——复杂性的累积。文章指出，复杂性并非源于重大错误，而是由无数看似合理的小妥协（如随意添加开关、复制逻辑、临时补丁）层层叠加所致，最终导致变更放大、认知负荷加重、未知的未知增多。在此基础上，文章对比了“战术性编程”（追求短期交付速度，忽视设计）与“战略性编程”（以长期可维护性为目标，持续投入10%–20%时间优化架构）的本质差异，并系统阐述了管理复杂性的核心方法。作者强调：真正的开发速度来自

2026-03-16 17:58:09 575

原创用自然语言替代复杂代码

核心价值在于将高理解成本、难维护的硬编码逻辑，转化为可读性强、修改便捷、开箱即用的 AI 驱动分析流程，并在开发效率、维护成本、响应速度和业务价值上实现显著提升。天猫技术是阿里巴巴旗下专注于电商场景的综合技术团队，不仅服务于自身电商业务增长，也在不断探索如何用AI、大数据、交互技术赋能行业交易、品牌营销与消费者体验，成为全球领先的品质购物平台和技术引擎。AI 平台就像一个"AI 能力超市",我们选择合适的 Agent,填充参数就能用。这种"能力平台化"的思路,才是 AI 真正赋能业务的方式。

2026-03-13 16:34:11 509

原创 AI工作流在淘宝交易舆情巡检上的探索与实践

再将相关舆情数据结构化后投喂到AI，最后根据我们自定义的业务规则及波动阈值进行舆情预警并进行消息推送，至此完成巡检部分的工作，当然后续还有舆情归因及复盘反馈的环节，但是这个部分的能力我们还在持续建设中，暂时先不。AI 负责发现问题、聚合信息、提供建议，而最终的判断和决策权，始终交给业务同学。，来自淘天集团-交易业务技术团队，本团队专注于下单、支付、物流、服务、逆向退款等核心交易链路的技术团队，我们面向亿万用户致力于打造极致流畅、安全稳定的购物体验，为用户和商家的每一次交易行为保驾护航。

2026-03-06 18:25:24 664

原创 ICLR 2026 | 基于概念蒸馏的生成式视频复原算法Vivid-VR

具体来说，给定一个文本-视频对，我们对源视频施加特定强度的噪声，然后使用T2V基座模型，在文本描述的引导下对噪声视频进行去噪重构。我们采用上述过程生成。在生成式视频复原的新范式下，如何利用强大的T2V基座模型修复低质视频，同时避免基座模型在微调过程中“遗忘”原有的生成能力，是学术界关注的焦点。团队兼顾算法创新与工程应用，为视频生产，直播推流，美颜美化，视频特效互动，视频渲染，视频修复、生成，视频编码，视频传输，视频播放等完整链路提供底层音视频技术，保障视频、语音、图片相关业务的流畅度和音画质体验。

2026-03-04 16:28:08 683

原创 AI Coding思考：从工具提效到范式变革，我们还缺什么？

相关的技术资产，无论是生产资料，还是（软件）产品，既有基于物理真相的关系刻画，又有基于架构抽象的、易于人类理解的逻辑表达——本质上是技术资产及其内在关系的语义化、在线化（企业级软件资产图谱），这是企业全局架构视角面临的挑战，在AI时代的研发提效背景下，这件事情变得更为急迫（决定了公司研发效率方面在未来的竞争力）。比如现在PD使用Web形态VibeCoding工具快速生成产品原型，HR用它快速开发一个文化活动的页面，这些场景下程序员的工作完全被代替了，PD的角色职责也发生了变化，这是质变的。

2026-03-02 16:10:53 1044

转载首届淘宝电商AI挑战赛来了！设350万赛事奖项和千万扶持资源

届时，由淘天、千问大模型等背景的产品技术专家、行业运营专家和知名媒体人等组成的专家评审团，将聚焦。此外，主办方还将为获奖者对接业内大咖、创投机构、政府和产业扶持资源，助力。产品的持续落地，电商人在运营提效和经营增长上会迎来越来越多的可喜变化。近期，由浙江省商务厅指导，淘宝开放平台、千问大模型、阿里云联合举办的。产品市场前景、技术能力、创新性和产品实战效果等维度，选拔出。正在重塑电商经营，也已成为商家重构增长的现实选项。月份结合商家出题的结果同步给进入决赛圈的选手，并在。工具进化、生态共赢、商业新生。

2026-02-27 16:17:08 418

原创 AI真人数字人语音对话性能优化实践总结

原始的导购对话流程，基线数据的链路是"ASR → LLM → TTS & A2BS"的三段式结构：ASR 识别结束后发起文本请求，获取请求之后，当达到一定的标点符号截断，才会调用 TTS和面部动画生成，回传结果之后，再播放音频和面部动画。对于用户而言，最关心的是问完问题之后，多久能够得到数字人的回复。对于整体解决方案，完整的性能监控打点机制是优化的基础，具体实施时，一方面，我们用更合适的模型，端测针对新模型增加输入输出链路，另一方面，端测针对A2BS进行窗口累积和语音表情同步的处理，保障链路的正确性。

2026-02-25 17:37:25 706

原创从应用架构的视角看退小宝AI助手落地现状

本文从应用架构视角系统分析了AI（尤其是LLM）在实际业务中落地的现状与挑战，以“退小宝AI助手”为典型案例，对比传统Web应用与AI应用在响应时间、输入灵活性、准确性、可用性、成本及嵌入适配性等维度的根本差异，指出AI原生应用（而非简单在旧系统中嵌入AI模块）是更可行路径；进而梳理了AI应用的典型架构演进：从简单调用模型API，到ReAct Agent范式，再到以Workflow（工作流）为核心的低代码图结构实现；深入解析了LLM、Message、Tool、RAG、上下文（State）、MCP、微调、可观

2026-02-11 17:29:45 859

原创设计模式Trustworthy Generation：提升RAG信赖度

在面向一些复杂问题的回答时，可能会检索召回比较多的doc，同时最终结论生成的内容中每个段落，都是结合了多个doc的内容来关联生成的，因此还是会存在模型会生成逻辑错误（不同的内容编排形式可能就会引入重大事实差异）或事实错误（参考的doc太多，上下文一长，容易自我发挥）；在我们设计和应用RAG时候的初衷是，为当前用户的query补充相关联的高质量信息，但是有时候随着事情的发展，会有一些事与愿违的情况发生，没有帮助降低模型幻觉，反而助长了模型幻觉产生的可能；：会增加系统复杂度与计算开销，并存在误过滤风险；

2026-02-09 17:17:08 805

原创【AI Coding】借助cursor实现业务需求全栈交付实践

所以全栈交付的过程中，还是建议去多了解技术栈的基础知识，再搭配AI工具，会更加的游刃有余。到这里，大概明确了问题原因，CSR链路下，在预发环境下，受Feeds接口请求耗时的影响，预加载会失效，只有等待用户翻页，才会继续请求，SSR链路下，没问题。因为首页需要商品去重，首页单品返渠道卡片Feeds的请求和主页Feeds存在时序，cursor一开始实现时，采用双状态：page1Loaded、page2Loaded来分别记录页面的加载状态，但综合来开，最后对状态的使用时机，单个状态即可满足要求，让AI帮忙优化。

2026-02-06 17:24:37 1005

原创一次大文件处理性能优化实录

过去一年主导了多个高价值项目，包括：支撑618、双11、春晚等亿级流量洪峰、构建业界领先的全网价格力体系、承接淘宝全面接入微信支付、搭建集团最大的AI创新平台-ideaLAB，支撑淘宝秒杀等创新业务的高速增长。四大主线，系统性地展示了从初始637秒（Java）到最终3.2秒（新架构）的百倍级优化过程，并提炼出可复用的通用原则（如大缓冲区、字节操作、零分配、原生系统调用等）及进阶解耦架构（IO进程 + Processor进程）。通过设置大 Socket 发送缓冲区（1-16MB）和批量发送，

2026-02-04 17:29:00 852

原创淘天集团自营技术运营算法团队4年2次荣膺 INFORMS“杰出实践奖”决选荣誉：以策略正则化突破DRL在库存管理中的落地瓶颈

相比之下，本文在充分进行超参数调优的前提下，对 DS 与传统 DRL 进行了公平而严格的比较。数据效用：在电商中可用于预测与决策的数据其实十分有限，原因在于经营目标、竞争格局、营销节奏和运营策略快速变化，使大量历史数据失去对未来的预测与泛化能力，因此依赖“大数据 + 大模型 + 大算力”的方法往往难以奏效；数字世界与物理世界的超级AI”这一战略愿景，聚焦构建可解释、可泛化、可信赖的智能决策基础设施，在大模型、运筹优化、强化学习等方向不断突破算法边界，加速推动前沿技术向产业级应用的深度赋能。

2026-02-02 17:05:24 1143

原创【淘宝直播数字人互动LLM】告别AI感：基于真人ASR数据的拟人化探索

为了进一步简化线上链路，笔者在前置工作的基础上设计了一个拟人化奖励模型，加入到原有强化学习训练链路中，训练得到对应的拟人化生成模型。传统的方法通过提示词工程让能力更大的模型（Gemini，DeepSeek-r1）自主生成的一定风格的回复，后续基于此数据进行微调，模型自身带有的AI感仍然无法去除。在此基础上，设计拟人化判定模型，将其融入到GRPO训练框架中，进一步简化了整体链路，模型无需改写就可以直接生成拟人化的回复。拟人化的效果很大程度取决于训练数据，无论是网上还是书籍里的数据，其实拟人化的风格都很弱。

2026-01-30 17:11:41 1235

原创 Agentic Coding场景下基于职责分离的上下文管理思路分享

需要注意的是部分⽼项⽬或不规范项⽬中可能会存在编码不⼀致的问题，例如utf8和gbk混⽤的情况，如果未使⽤准确的编码读取⽂件内容可能导致注释、⾮英⽂常量⽆法被模型识别导致⽆法正确理解“业务含义”（代码逻辑之外的信息）。在aone copilot中使⽤了类似的思路，⼤约只会保留最近250次的操作内容，可以右键打开 devtools来查看交互的对话内容。输⼊的token也是会计费的，⽤块⼯具读取完整的⽂件内容⽐直接读取完整的⽂件内容会增加多次重复上下⽂的调⽤，导致成本的上升。记得刚刚关闭的⽂件中的关键信息。

2026-01-28 16:38:38 836

转载如何设计一个AI Agent系统

对于在现有产品基础上引入AI的场景，由于准确率可能还不够完美，需要采用"人机协同"的过渡策略，保留原有交互作为兜底，让用户可以在AI建议和传统操作间灵活切换，逐步建立对AI的信任。真正有价值的知识包含多个层次：显性的文档规范、隐性的专家经验、平台沉淀的案例库、实际操作中发现的边界情况。架构设计时，只有理解业务才能判断哪些环节需要智能、哪些需要确定性，在Prompt工程中，业务理解更是核心：什么是正确的输出格式，哪些边界情况需要特别说明，对业务理解的深度决定了一个Agent架构的潜力。

2026-01-26 16:51:49 887

空空如也

空空如也