阿里巴巴淘系技术团队官网博客-CSDN博客

原创淘系技术，实力为2019年双11而战！稳！

今年，双11走到了第11个年头，史无前例的，阿里经济体内有49支技术团队共同参与作战，也是第一次，双11的核心系统将100%跑在云上，这无疑让今年的双11技术作战充满了更大的挑战。正如2019年双11技术团长平畴（汤兴）说的“「善战者，无智名，无勇功」，这是我们技术人最高的境界”。我们一起捍卫了阿里技术人的荣耀，一个字 “稳”！年年双11，回回新玩法，“在吗，盖楼吗？”成为了好友聊天的日常，每天蹲...

2019-11-12 00:38:06 22541 7

原创探秘TaoAvatar：淘宝3D真人数字人技术解析

未来三年，随着3D重建大模型、AIGC编辑等技术的突破，结合多模态语音大模型赋能的毫秒级对话能力，3D 数字人将不再只是商业工具，而将成为每个人在数字世界的化身——既能随心切换服饰妆容参与虚拟社交，也能带着我们的思维习惯执行智能任务。，正是集成了这些前沿技术的3D真人数字人产品。TaoAvatar自研的低成本多视角相机阵列，仅需15分钟即可完成真人数字分身的高精度拍摄，表情、手势和动作的捕捉，自研AI动态重建算法在1周内便可交付自然驱动的3D真人数字人，显著降低成本与周期，让超写实数字人真正触手可及。

2025-06-11 18:04:43 301

转载阿里淘天T-Star Lab 技术Openday 报名开放

点击阅读原文报名。

2025-06-09 15:01:45 30

原创 Agent工程能力思考记录

除了HSF，其实还有很多业务团队常用的接入诉求，比如SLS日志查询的接入，ODPS表读取的接入，IDEAs服务的接入等，这些能力可以快速支撑起一个简单的应用场景，譬如我之前文章里面的FlowLink原子能力接入后台、多啦a梦平台，本质上都是做的工具接入提效；对于MCP中心来说，也可以通过一些更通用的工程化手段来处理，比如在服务发现的末端，基于用户的请求前置过滤一些与本次无关的工具，可以是通过向量相似性或是LLM来处理，这种二阶段工具匹配的做法不仅可以减少长任务下的上下文长度，还能提高工具匹配的准确性。

2025-06-06 15:16:01 620

转载大模型微调知识与实践分享

此外，Transformer的权重矩阵包括Attention模块里用于计算query, key, value的Wq，Wk，Wv以及多头attention的Wo,以及MLP层的权重矩阵，LoRA只应用于Attention模块中的4种权重矩阵，而且通过消融实验发现同时调整 Wq 和 Wv 会产生最佳结果。提升模型在正样本上的概率（优化模型在正样本上的概率大于参考模型在正样本上的概率），降低模型在负样本上的概率（优化模型在负样本上的概率小于参考模型在负样本上的概率）。

2025-06-04 15:57:19 50

原创当我们在谈多端一码时，我们在谈论什么

文章从背景问题出发，详细阐述了 KMP 的核心技术特性，并结合直播业务的实际场景，分享了从技术预研到复杂业务落地、再到架构迁移的完整经验。随着直播技术业务的不断迭代，直播各端业务代码以及架构差异变得愈发明显，同时双端不平衡的开发资源也加剧了这种差异的产生。如何解决这些差异，首先映入脑海里的自然是一些已经较为成熟的跨平台方案，例如 Flutter、 Weex(2.0) 和 DX 等等，但是这些跨平台方案实际上在直播业务中都有过各种尝试，因为各自的一些特性以及直播业务的特殊性，最后都没能实现多端一码的目标。

2025-05-30 15:49:01 626

原创淘宝直播组件调度、复用和治理

直播间组件的加载都是比较耗时的。前面我们说到过组件治理的一个方向是组件渲染的优化，目的是通过优化视图布局层级，使用更稳定、优化的布局方式，提升组件上屏渲染的性能。是指组件本身的复用（组件对象和组件对应视图 View 的复用）以及组件内部元素的复用（比如基于列表 RecyclerView 组件的 RecyclerView.ViewHolder, DX View 的复用等等）上面我们说到直播间组件加载的三段式中，组件的注册和组件视图创建并不是每次上下滑都会执行的，因为存在直播间组件的复用。

2025-05-26 16:30:24 1009

转载淘宝Java工程师的LLM开发实践

Embedding 是一种强大的技术，它能够将高维、稀疏的离散数据，如文本、图像、用户行为等，映射到低维、稠密的连续向量空间。而切分后的小块文本更易于进行索引和检索，能够加速检索阶段的相似度计算。在这些领域中，使用 Fine - Tuning（微调）技术可能是一个更为合适的选择，通过微调可以使模型更好地适应特定领域的需求，提高模型在该领域的性能和准确性。在这一阶段，首先会将用户输入的 query 发送给向量数据库进行相似度检索，然后把检索到的内容输入给 LLM 进行总结生成，最后将最终的结果返回给用户。

2025-05-23 19:30:00 139

转载 CursorRules：AI编程助手规则调优实战

它可不是简单的配置文件，更像是你给 AI 助手量身定做的"行为规范手册"，或者说是孙悟空头上的那个"紧箍咒"——当然，咱这是友好的、为了高效合作的"咒"。但现在，Cursor 更推荐用新的方式（老方法未来可能不支持了哦）：在项目根目录下创建一个 .cursor 文件夹，然后在里面再建个 rules 文件夹，最后把你的规则分门别类写在不同的 .mdc 文件里，比如 python.mdc 管 Python 的事，react.mdc 管 React 的事。一般来说，项目特定规则的"威力"更大。

2025-05-21 16:56:09 278

原创淘天⾃营质量技术AI智能体的实践和思考

我们积极探索前沿技术，持续技术创新和突破，用AI驱动质量革新，保障亿级系统可靠性，提升系统的稳定性和安全性，让用户享受更好的服务体验，让商家更高效、低成本地运营。文章详细阐述了AI智能体的整体架构设计、核心能力（如工具调度、数据查找、链路诊断等）、具体实施方案及其应用效果，并展望了未来在AI赋能质量技术领域的规划与发展方向。注意⼯具语义描述，⼯具的基础信息能够准确⽀持⽤户查找、使⽤他的所有场景，并且能够区别其他相似⼯具。常⻅有2种接⼊⽅式，⽅案1⽆法做到通⽤，本⽂重点介绍⽅案2的实现。

2025-05-19 17:23:33 1070

原创 JianYi: 淘宝家装行业的分割&抠图系统

一支专注于通过 AI 和 3D 技术驱动商业创新的技术团队，依托大淘宝丰富的业务形态和海量的用户、数据，致力于为消费者提供创新的场景化导购体验，为商家提供高效的场景化内容创作工具，为淘宝打造围绕家的场景的第一消费入口。我们不断探索并实践新的技术，通过持续的技术创新和突破，创新用户导购体验，提升商家内容生产力，让用户享受更好的消费体验，让商家更高效、低成本地经营。在抠图的后处理阶段，我们摒弃传统的腐蚀和膨胀方法，采用联通域合并和最小集提取技术来过滤噪声，确保抠图结果更清晰准确。

2025-05-16 14:55:45 1073

原创浅谈团队代码风格/结构一致性

我所在的团队，一部分职责是开发维护直播业务中主播直播售卖商品的时候的CPS佣金体系，完成消费者点击商品的行为跟踪，以及下单后把订单归因到主播，以及后续的计费、扣佣过程。轮子是2022.06开始造的，作为技术演进的项目，推进方式上主要是两个点：新的服务、应用直接采用规范的代码模式，老的应用和服务，随着业务需求的演进和人力情况逐步迭代。当然也可以做复杂的编排。珠玉在前，所以去解决前面提到的问题，很好的思路就是在应用中以某个框架形式的代码约束，统一代码分层风格，并逐步推广到域内的多个应用，实现规模化的效果收益。

2025-05-14 17:34:43 920

原创淘天自营前端开发的AI增效实践总结

目前鸿雁 AI Coder 的主要用户仍然是前端开发同学，但随着文本大模型和多模态大模型的发展，输入口语化的描述，就能得到优质的文档/原型图，也能够为其他领域的工作提效。从最开始功能独立的 AI 工具到融合开发生态的 AI 插件，再到包罗万象的 AI 平台，什么才是最适合我们、最适合业务、最适合真正落地的方案呢。在AI重塑生产力的时代浪潮中，技术团队始终在探索效率的边界。与鸿雁 ABC 工作台深度集成，实现“一站式”开发到投产，模块、迭代、仓库、代码都有了，你需要做的只是点点按钮，改改细节。

2025-05-07 19:09:35 1270

原创 MCP入门指南：大模型时代的USB接口

类似于USB接口对计算机的作用，MCP为人工智能提供了一种通用的连接方式，能无缝整合数据源、工具和上下文信息，从而显著增强AI的能力。作为"大模型时代的USB接口"，MCP提供了一种标准化的方法，使AI能够访问各种数据源、利用多样化的工具，并在更丰富的上下文中工作。MCP作为一个开放且标准化的协议，在连接AI与外部世界方面具有革命性意义，不仅提升了AI的功能边界，还为开发者和用户提供了前所未有的便利。对于开发者而言，MCP简化了集成过程，减少了重复工作，并提供了更安全、更可控的方式来增强AI功能。

2025-04-30 16:32:01 1133

原创亿级流量下的前端高可用架构实践：淘宝春节许愿主互动

在上面的视频中我们可以看到，在我们的玩法中，用户一共有 30 个心愿，在用户许完所有愿望之前，可以不停地循环需要，所以对应的我们的灯笼动画的执行也是一个循环的过程，整个过程可以拆解为几个阶段：灯笼入场、心愿选择、心愿编辑、完成心愿选择，灯笼飞去中间、玩法点亮灯。主玩法动画交互链路复杂，一共有 100 + 动画元素，包括（spine、lottie、css、视频等不同类型），在不同的业务流程中，需要对不同的动画元素进行按序组合，保证在同一个动画流程中不同动画的执行顺序。

2025-04-28 16:18:12 1162

原创 2025淘宝春晚互动小游戏技术方案揭秘

渲染会被中断，从而出现灯不见的情况，并且我们本次春晚为了保障灯笼的清晰度，使用的灯的素材也是高画质，尺寸非常大，尽可能没有压缩，所以在渲染灯时，会更容易出现内存不足情况。的物理引擎，但是由于本次场景中，碰撞的场景不多，并且我们追求极致性能和体验，所以我们本次小游戏的实现中没有使用物理引擎，而是采用更轻量的方案实现，每帧计算碰撞情况。年春节主互动的技术实现，揭秘春晚互动背后复杂的前端方案如何应对高并发与跨端协同的技术挑战，并通过万字长文全面解读春节主互动前端技术的演进与升级。然后，对网格中的每个顶点进行。

2025-04-25 15:24:06 1372

转载读书笔记：淘宝十年产品与技术演进史

打折不是促销，而是立减。“考古”是一个很有意思的事情，因为可以通过一些材料，去回想当时人们的生活环境，遇到的问题，以及如何解决，可以了解前人的智慧，汲取力量。到 2008 年初，整个主站系统（有了机票、彩票系统之后，把原来的系统叫做主站）的容量已经到了瓶颈，商品数在一个亿以上，PV在2.5亿个以上，会员超过了5000万个。这时 Oracle 的连接池数量都不够用了，数据库的容量到了极限，即使上层系统加机器也无法继续扩容，只有把底层的基础服务继续拆分，从底层开始扩容，上层才能扩展，才能容纳以后三五年的增长。

2025-04-23 17:26:22 388

原创 MNN LLM：让你手机本地也能跑 DeepSeek R1 还能支持多模态

modelscope 用户可以下载后指定 config 文件运行，例如./mls serve -c /Users/songjinde/.cache/modelscope/hub/MNN/DeepSeek-R1-1.5B-Qwen-MNN/config.json。下载完成后，记得在 ~/.mnnmodels 文件夹下找到找到配置文件，设置 config.json 中的 backend 为合适的 backend, 例如 mac 上建议设置 backend 为 `metal`。

2025-04-21 16:02:37 1602

原创 AI驱动研发效率在中后台的实践

除了日常的研发辅助类的工具（如：Cursor，Copilot类产品）以外，希望能针对业务特色的痛点和专属场景，在现有流程上进行定制，不仅仅是辅助编码，更是的研发模式的升级和和扩展。我们统计了团队内部的同学在一线业务需求研发的过程中，研发流程各个阶段的耗时比例，统计的方式主要是通过一线开发同学的主观反馈，因为一个需求研发过程并不是连贯的，大部分的同学手里同时都在做多个需求，并且也会由于各种客观原因，比如需求发生调整，业务以来信息还没有准备完成，人员抽调等等，很难进行精确的时效统计。

2025-04-18 16:15:46 1580

原创 2025 AI驱动研发工具对比丨独立测评

这一类的产品AI驱动的全栈Web开发工具,主要是将大模型与浏览器内开发环境集成，适合新手或喜欢简洁界面的用户，提供直观易懂的操作界面，有的产品专注于UI设计实现，便于快速完成产品原型设计,非常适合前端开发者和设计师。相信绝大部分的开发者接触的第一款AI研发工具都是copilot，在第一次使用时候带来的那种震撼的感觉，但是随着时间的发展，copilot似乎没有很好的维持自己的先发优势，开源的竞品在产品力和出码效果上都紧追不舍。其基于浏览器的环境简化了工作流程，尽管它可能面临非常复杂的项目的限制。

2025-04-16 16:36:25 1591

原创基于AIGC技术的营销短视频生产方案及业务实践

在过去的几年团队持续以技术驱动产品和商业创新，在给业务创造价值的同时，也在Agent、可控图文、视频生成，多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索，在NIPS，CVPR，ICLR等顶会发表了数十篇论文，欢迎对团队技术工作感兴趣的同学进行交流。我们需要解决的问题是将冗长的5-10分钟直播看点视频高效转化为更精简、更具吸引力的短视频，同时结合商品的丰富信息，例如主图、主图视频及其他相关可用素材，以进一步增强视频的营销效果。对此，我们结合了视频画面信息，以进行更精细的裁剪。

2025-04-14 17:41:51 1375

原创淘宝质量保障之主动预警能力建设

接着，文章介绍了预警流程的设计，借鉴。部分开发在配置平台中配置了时间字段，因此时间过期也是需要预警的问题，这个核心解法是通过全量扫描制定应用的配置平台配置中的关键字，如time，date等，发现配置的Key和value中存在此字段，就解析对应的值，来检查是否满足过期告警时间。在业务的质量保障过程中，主动预警是较为重要的一项，可以帮助我们提前发现问题，尤其是权益过期，库存耗尽，资源位过期等问题，等到监控发现时再恢复，再快也快不过提前预警，因此，我们探索在业务各个方面实现主动预警监控的能力。

2025-04-09 16:27:39 1150

原创基于Flow-matching的扩散模型原理解读

虽然我们不在此证明该公式，但可以从物理直观上理解：在微观层面上，空气中每一点处的空气分子的运动方向和速度是随机的（可以用一个随机微分方程描述），但是在宏观上可以用统一的“风速场”进行描述（可以用常微分方程描述）。在过去的几年团队持续以技术驱动产品和商业创新，在给业务创造价值的同时，也在Agent、可控图文、视频生成，多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索，在NIPS，CVPR，ICLR等顶会发表了数十篇论文，欢迎对团队技术工作感兴趣的同学进行交流。描述了变换过程中空间伸缩的程度。

2025-04-07 16:21:22 1218

原创虚拟线程/有栈协程对于Java的意义

但是 java 的虚拟线程并不是完美的，假设有某种场景，使得虚拟线程挂载在载体线程上，而无法卸载（称之为pin），而此时，虚拟线程调用了阻塞IO被阻塞，那么载体线程也将会被阻塞。后来随着多核技术的兴起，Linux 也提供了多线程的能力，这时“绿色”线程的劣势就暴露出来了，它本质上还是只能使用操作系统的单核进行并发，无法充分利用多核进行并行操作，并且所有的线程阻塞、调度逻辑都需要由 java 实现，而不能使用操作系统的能力。同理，在协程中，关键问题就在于怎么存储、恢复、切换协程的上下文。

2025-04-02 16:45:02 1329

原创音频生成技术探索与淘宝域实践

在过去的几年团队持续以技术驱动产品和商业创新，在给业务创造价值的同时，也在Agent、可控图文、视频生成，多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索，在NIPS，CVPR，ICLR等顶会发表了数十篇论文，欢迎对团队技术工作感兴趣的同学进行交流或者加入我们。此外，收集的数据质量对于最终合成语音的效果有着决定性的影响，优质的训练数据对于模型的效果至关重要。但是，随着规模的增大数据集的质量也出现了一定程度的下降，数据集中出现了噪音、多人对话的音频。这样的交叉验证进一步保障了转录文本的准确性。

2025-03-31 19:20:39 1032

原创淘宝客户端动态化页面搭建

而且由于需要携带的信息变多，协议包大小也会有所增加。业务可以通过LifecycleManager.registerLifecycle注册页面的生命周期监听器，对外暴露的生命周期包括系统生命周期（Android onCreate/onDestroy，iOS didAppear/disAppear等），以及自定义的一些页面生命周期切面，比如网络请求、数据处理、预加载等切面。虽然页面整体布局方式大致一致，但是各个版本之间的代码基本是割裂的，如果需要升级协议，每次的工作量都是巨大，而且切流过程也是比较复杂。

2025-03-28 15:07:19 1441

原创技术人的大模型应用初学指南

基于已有开源大模型进行微调训练，如果采用预训练的方式对模型的所有参数都进行训练微调，由于现有的开源模型参数量都十分巨大，如最新千问72B模型(qwen/Qwen1.5-72B-Chat)有720亿参数，对所有的参数都进行处理，那GPU资源成本会非常高，可能高达数百万每年，为了解决这个问题，社区提出了大模型微调的概念：PEFT (Parameter-Efficient Fine-Tuning)，即对开源预训练模型的所有参数中的一小部分参数进行训练微调，最后输出的结果和全参数微调训练的效果接近。

2025-03-26 15:30:40 1210

原创 AI赋能：大模型创新的模板生成与内容填充

在过去的几年团队持续以技术驱动产品和商业创新，在给业务创造价值的同时，也在Agent、可控图文、视频生成，多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索，在NIPS，CVPR，ICLR等顶会发表了数十篇论文，欢迎对团队技术工作感兴趣的同学进行交流或者加入我们。图3-3展示给定一个非表格类模板，以及两个充电宝的商品信息，模型首先会对提供的 HTML 模板进行分析，从给定的商品信息中提取模板填充所需要的素材（标题、副标题、段落标题和正文）等，然后进行准确的、自适应的内容填写。

2025-03-17 15:27:50 992

原创淘宝直播AI提效探索的一些心得

这个案例取自服务端代码生成项目上，其实内部的aone copilot在通用任务上做的非常好用了，官方统计的采纳率也达到了25%，是个非常不错的code copilot的产品，但是对于业务侧的开发来说，这类copilot生成的代码，属于基础实现代码，因为不太能很好的结合当前业务下沉淀的服务、方法来做代码生成，因此我们需要把这部分所谓的服务、方法、工具等接口信息和使用case给到LLM，它才能结合这样的context去做最终代码的生成；随着你继续预测更多的词，这些小比例的错误会累积起来，出错的可能性也会增加。

2025-03-14 14:50:06 1261

空空如也

空空如也