• 博客(1436)
  • 收藏
  • 关注

原创 淘系技术,实力为2019年双11而战!稳!

今年,双11走到了第11个年头,史无前例的,阿里经济体内有49支技术团队共同参与作战,也是第一次,双11的核心系统将100%跑在云上,这无疑让今年的双11技术作战充满了更大的挑战。正如2019年双11技术团长平畴(汤兴)说的“「善战者,无智名,无勇功」,这是我们技术人最高的境界”。我们一起捍卫了阿里技术人的荣耀,一个字 “稳”!年年双11,回回新玩法,“在吗,盖楼吗?”成为了好友聊天的日常,每天蹲...

2019-11-12 00:38:06 22865 7

原创 Agentic Coding场景下基于职责分离的上下文管理思路分享

需要注意的是部分⽼项⽬或不规范项⽬中可能会存在编码不⼀致的问题,例如utf8和gbk混⽤的情况,如果未使⽤准确的编码读取⽂件内容可能导致注释、⾮英⽂常量⽆法被模型识别导致⽆法正确理解“业务含义”(代码逻辑之外的信息)。在aone copilot中使⽤了类似的思路,⼤约只会保留最近250次的操作内容,可以右键打开 devtools来查看交互的对话内容。输⼊的token也是会计费的,⽤块⼯具读取完整的⽂件内容⽐直接读取完整的⽂件内容会增加多次重复上下⽂的调⽤,导致成本的上升。记得刚刚关闭的⽂件中的关键信息。

2026-01-28 16:38:38 178

转载 如何设计一个AI Agent系统

对于在现有产品基础上引入AI的场景,由于准确率可能还不够完美,需要采用"人机协同"的过渡策略,保留原有交互作为兜底,让用户可以在AI建议和传统操作间灵活切换,逐步建立对AI的信任。真正有价值的知识包含多个层次:显性的文档规范、隐性的专家经验、平台沉淀的案例库、实际操作中发现的边界情况。架构设计时,只有理解业务才能判断哪些环节需要智能、哪些需要确定性,在Prompt工程中,业务理解更是核心:什么是正确的输出格式,哪些边界情况需要特别说明,对业务理解的深度决定了一个Agent架构的潜力。

2026-01-26 16:51:49 59

原创 ICCV25 | 淘宝人脸吸引力预测算法FPEM

在淘宝,每天有数十万的直播间存在美颜需求,人脸的吸引力已成为影响直播用户整体视觉体验的核心变量,通过实时监测确保美颜效果的稳定性,对保障主播和用户的双端体验至关重要。为更好地适配淘宝直播平台的数据场景,我们基于淘宝直播平台的视频,构建了大规模直播场景下的人脸吸引力预测数据集LiveBeauty,包含10,000张图像,涵盖不同美颜算法参数、光照条件、面部表情,并通过专业的主观标注,获取200,000个对应的主观分数的标注数据。从表中可以看出,先前的数据集闭源的较多,开源的数据集则规模偏小。

2026-01-23 16:31:33 1021

原创 AI+时代工程师的空间在哪儿——从范式演进看技术机会

本文探讨了AI时代工程师的核心价值与技术机会,指出随着大语言模型(LLM)从GPT-1演进至Agent智能体阶段,工程师的关键角色已从“调用模型”转向“深度挖掘模型潜力”的系统性工程实践。作者通过四阶段范式演进梳理技术脉络指出模型决定智能下限,而工程师对业务场景的拆解能力、系统架构设计能力(流程编排/工具抽象/记忆机制/评测体系)才是决定产品体验上限的关键——AI工程师正从“炼丹师”进化为“系统架构师”与“场景定义者”。前言随着⼤语⾔模型(LLM)从 GPT-1 进化到如今的 Agent 智能体时代,我们往

2026-01-21 17:03:53 379

原创 淘宝订单列表体验优化实践

随着闪购业务的上线,订单列表新增一级tab类型,其包含了全部订单、购物、闪购、飞猪等等不同业务场景,支持根据用户的行动轨迹以及订单状态,通过算法首屏直达指定tab。多tab实例架构对推荐流的原有架构产生了很大的影响,在单实例模式的情况下,由于只有一个实例,所以每次切换tab时,都会去重新构建一个推荐流的view加载到订单列表View上。单实例架构下,例如在全部订单tab下立即付款、确认收货后,当前tab会立即刷新的,并且切换tab时,由于单实例架构的销毁重建机制,待付款列表自然也会拿到最新状态的数据。

2026-01-19 16:58:59 833

原创 AI 无障碍 CR 与自动适配实践:从问题洞察到效果验证

在此基础上,未来我们还计划将方案从当前的 Web / DX 场景扩展到 Native 页面:我们会针对 iOS / Android 等原生技术栈,补充针对控件语义、系统辅助功能(如 TalkBack / VoiceOver)以及原生导航模式的规则与示例,并基于现有能力继续演进「AI 检测 + 智能修复」链路,为 Native 代码提供无障碍问题识别、属性自动补全和改造建议;在丰富的业务场景下,通过持续的技术探索创新突破,给数亿用户提供可靠的交易保障、极致流畅的操作交互以及顺滑的购物体验。

2026-01-16 17:16:55 1035

原创 支配树算法原理及鸿蒙工具实践

本文作者灵貎,来自淘天集团-终端平台基础工程团队,团队负责淘宝App基础架构和基础链路业务,致力于通过技术创新和系统优化,打造一个更稳定、更流畅的手机淘宝。_index存储的是strings中的名字index,11673对应的是-subroot-字符串to_node代表的是这条边指向的节点索引,因为内存引用构成是一个有向图,所以还需要知道这条边来自于哪个节点。3. 对于⾮根节点 n , Dom(n) = n ∪ (∩Dom(p)) ,即当前节点 n 并上所有前驱节点 p的⽀配节点的交集。

2026-01-14 19:11:53 328

原创 淘天业务技术2025年度热门文章盘点

涵盖其底层机制(如Token计算、工具调用、Codebase索引与Merkle Tree)、提升对话质量的方法(如规则设置、渐进式开发)、实际应用场景(如代码检索、绘图生成、问题排查),并推荐了结合AI的编码最佳实践,包括文档、注释、命名规范和安全合规,旨在帮助不同经验水平的开发者真正把AI工具用好。通过在生产环境长期采集代码执行数据,生成覆盖率报告并集成到开发环境,团队显著降低了代码冗余(如B应用清理71%的代码),提升了系统可维护性,并总结了技术选型、热部署兼容、插件开发等方面的经验与教训。

2026-01-12 17:34:41 689

原创 GenAI输出内容控制的5种设计模式

当前的做法是在prompt中写清楚需要返回的信息的格式,比如是JSON,或者是一些特殊的sql,虽然Anthropic也推荐了这样的做法,但是这个方式不一定能保证结果格式的输出一定能如你所愿,头部的大模型在模型能力上有比较好的调优,可以在更大概率上遵循用户在prompt中约束的指令,但是小一些的模型,在这方面的表现就会比较差,同时不管是头部闭源模型还是一些自己部署的小模型,在输出格式遵循的确定性上,都是有一定的概率;淘宝直播作为全球领先的直播电商平台,正在重新定义人与商品、人与内容的连接方式。

2026-01-07 18:17:11 737

原创 AI工程vs传统工程 —「道法术」中的变与不变

从“道、法、术”三个层面对比AI工程与传统软件工程的异同,指出AI工程并非推倒重来,而是在传统工程坚实基础上,为应对大模型带来的不确定性(如概率性输出、幻觉、高延迟等)所进行的架构升级:在“道”上,从追求绝对正确转向管理概率预期;在AI工程落地的战场上,我们既未抛弃传统工程的“十八般兵器”,也未盲目迷信AI带来的“新式火器”,而是将二者熔铸为一套既能攻坚克难、又可稳守阵地的复合战法。如果你渴望在真实、高复杂度的业务场景中锤炼AI工程能力,与一群既懂技术又懂业务的伙伴并肩作战,这里将是你理想的舞台。

2026-01-05 17:21:14 1068

转载 AI架构师的诞生:AI+传统DDD模式 = 实现开发效率提升75%

根据人工拆解限界上下文部分,从原有 me.ele.newretail.contract.v6.domain 包下,帮我抽象出商品上下文的类,Repo、Service,类用Domain结尾,Repo用DomainRepo结尾,Service用DomainService结尾,输出成表格,包含方法和属性,就放到当前这个文档最后。从上一步可以看出,AI拆解的限界上下文是基于package结构进行拆分,未能深入分析业务语义,这是AI的薄弱环节,需要人工介入修正。这将成为软件工程的新常态。

2025-12-31 17:52:29 134

转载 天猫超市数据AI实践总结

从知识库概览图中可以看发现,知识库中强依赖知识间的联动,因此每一次修改都需要联动修改很多绑定部分,并且知识库需避免冗余知识,冗余知识会显著增加模型推理相同问题的不确定性和时间,这不是问数所需要的,因此在人工维护的情况下,无疑是巨大维护成本。总结了在构建面向AI的数据知识库中的实践经验,针对数据资产庞杂、语义不统一、维护成本高等问题,提出以“不重构模型、小而精维护、支持灵活扩展”为原则,通过结构化构建指标、实体、属性、表和字段五类知识,并结合图谱召回与Agent框架,实现自然语言到SQL的智能取数。

2025-12-29 17:15:31 135

原创 AI 辅助前端动画开发

AI 辅助代码生成在前端领域有两个难点,第一个是 Design To Code(下文检查称 D2C),D2C的出发点虽然也是需求文档,但前端拿到的是设计师交付的设计稿,如何将设计软件中的结构化数据映射为准确的前端UI,是目前阶段的一个难点,Pixelator 和 Figma 等团队都在探索。我在 Ani 平台上看到一个简单的进度条 Lottie 动画,背景色渐变的动画还挺好看的,我直接录屏交给微动画研发流程,其他物料都没给,AI 生成了 5 步的 Todo List,并封装好了动画组件。

2025-12-24 17:49:42 1193

转载 从代码生成到自主决策:打造一个Coding驱动的“自我编程”Agent

我们在前两个版本的时候,Prompt组装,是没有系统性、结构性设计的,这也就导致了过程中出现了一个900多行的超级大的Prompt,它里面各个位置的内容都是比较乱的。其设计理念来源于人类的大脑分区,我们将Agent的逻辑区域分成了:感知区、认知区、表达区、自我评估区、运动区,将不同种类的Act收纳到Area中,让整个架构体系看着更加的清晰,也让相同能力的动作,可以具备相互沟通的可能。单纯的向量数据库检索,不一定能让经验检索变得准确,我们目前正在向图索引的方向探索,让图谱的能力辅助经验的检索与加工。

2025-12-22 17:48:47 184

原创 SIGGRAPH Asia 2025 | 只用一部手机创建和渲染高质量3D数字人

高保真、可实时驱动、适用于移动端的3D数字人重建与渲染系统。接收,标志着其在学术与工业界前沿水平的认可。阶段采集策略学习的姿态相关的外表建模仍能⽣成。可动画神经表示以及基于⾼斯表示的⽅案。该工作已被计算机图形学顶级会议。系统对采集到的静态序列和动态序列。淘宝技术 — Meta技术团队,淘宝技术 — Meta技术团队。我们撰写的针对移动端的⾼保真实。我们提出了针对移动端的⾼保真实。为了尽量减少⽆效⾼斯的冗余计算。所建模的姿态相关的外表建模能够。为移动端数字⼈应⽤提供了可⾏技。姿态相关的外表建模对于跨姿态。

2025-12-18 18:23:59 1042

转载 AI编码实践:从Vibe Coding到SDD

动营销等多样化的业务场景,技术团队面临着需求迭代频繁、代码腐化及团队协作度高的问题,如何提升开发效率、保证代码质量、降低维护成本成为我们面临的重要挑战。正是在这样的背景下,我们开始尝试将AI技术融入到日常开发流程中,探索从传统编码到AI辅助编程的转变之路。带着上面的问题,我们开始尝试Agentic Coding模式,通过编写详细的提示词(Prompt),让AI一次性实现整个功能。我们相信,通过持续的探索和实践,一定能找到更适合团队的AI辅助编程模式,进一步提升开发效率和代码质量。

2025-12-15 17:47:42 464

原创 Jimi:打造Java程序员专属的开源ClaudeCode

作为十年Java老鸟,想为Java开源生态贡献绵薄之力,于是便有了本文:https://github.com/Leavesfly/Jimi。本团队主要负责淘宝行业&淘特C端链路的研发工作,包含:搜索推荐、互动游戏、导购、交易等基础服务,在这里可以探索更多AI场景,包含AI代码生成以及用Agent将电商各种场景重新做一遍的机会。首先是坚实的地基(基础设施),然后是稳定的骨架(核心引擎),再是灵活的功能模块(Agent和工具),最后是友好的交互界面(UI)。Agent中最火的是什么,AI-Coding;

2025-12-10 17:50:26 833

原创 2025淘宝直播双11花花乐动画实现方案思考&分享

关键的问题就是这个动画曲线如何获取,拿到了AE的源文件,能看到设计师手动拉的动画曲线,但是我们拿不到具体的值,自然也构建不了准确的动画曲线。关键的问题就是这个动画曲线如何获取,拿到了AE的源文件,能看到设计师手动拉的动画曲线,但是我们拿不到具体的值,自然也构建不了准确的动画曲线。好在这里有具体的值,我们可以反推公式,不过目前还有个更简单的方案,即直接把每一帧的值带入每一帧的渲染,类似算法中“打表”的方式来执行这个动画曲线。一旦首屏的花渲染完成,开始预加载升级时要用的素材和下个等级的素材。

2025-12-08 17:03:50 766

原创 复杂任务AI处理实践:淘宝工程师的实战手记

上游核心表变更时,需要下游逐个查代码确认影响范围。文章总结了一套可复用的方法论——如何将人工操作抽象为"感知-决策-执行"的 AI 闭环,并通过工单处理、数据治理、基线运维等真实案例,展示从"工具助手"到"智能体"的三种自动化模式。精准:在今年的数据治理中,AI处理了数千张表的治理决策,人工复核了10%高优先级的样本,未发现误删数据的情况,不过发现ai策略过度保守的情况存在。数据治理:查表信息及代码 → 看血缘关系 → 读上下游代码 → 查上下游信息 → 评估 → 给出治理方案 → 输出治理建议JSON。

2025-12-01 17:26:38 1183

转载 重构一个类,JVM竟省下2.9G内存?

文章深入分析了原始结构的内存浪费原因,并通过实测对比多种方案,验证了新结构在内存效率和查询性能上的优越性,强调了在大数据量场景下应警惕“通用容器”的隐性成本。正是在这一背景下,我们发现:看似合理的“通用集合嵌套”设计,在十万级商品 × 万级城市 × 多标签的规模下,竟成为内存消耗的“沉默杀手”。我们推测,当初的设计者可能是出于“未来扩展性”考虑(例如支持非数字标签),但在当前业务场景下,这种通用性牺牲了巨大的内存效率。在我们的核心业务链路中,存在一个对城市维度下某特定类型商品标签进行动态过滤的关键接口。

2025-11-28 17:22:43 178

原创 AI互动前端开发的思考和实践_

随着AI技术的发展,作者提出一种“规范驱动的AI协同开发”新模式:从“代码复用”转向“规范复用”,即通过制定统一的开发规范(Spec),利用AI按需生成针对具体场景的专用组件。团队在保证业务的同时,以先进的跨端框架和研发模式不断完善自己,打造最极致的体验和工程技术,保障多端设备的适配和稳定运行,并探索端智能等创新机会,通过技术高效驱动业务的良性发展。当AI能够瞬间生成代码时,真正决定交付质量的,不再是某一行语法是否正确,而是我们在需求萌芽之初,是否构建了一套清晰、可演进、可复用的认知框架。

2025-11-24 17:29:15 542

原创 代码染色&无效代码清理

但实际做代码下线并非容易,仅凭业务逻辑决策代码清理费时费力,还容易误删在使用的业务代码,因此非常需要工具来辅助做代码的清理,这就是基于代码执行染色和覆盖分析做代码下线方案的背景。离线方案的缺点在于,考虑到插桩代码运行存在性能损耗,如果不是所有在线机器都部署采集,每次部署就需要至少打出两份部署包:插桩版本的包和不做插桩的包,将插桩包部署到需要采集的机器,非插桩包部署到其它机器,这种分别部署的方式增加了部署调度的复杂性。自定义的方式对理解和实践插桩过程很有帮助,比较方便自定义的方式处理采集的数据,但存在问题。

2025-11-21 17:44:15 778

原创 交易订单表如何做索引优化

本文首先以淘天电商交易订单表线上一条非典型慢 SQL 的深入剖析为切入点,示范如何系统地分析与排查慢 SQL;接着详尽归纳了索引分类、B+Tree 与 B‑Tree 的结构差异、B+Tree 高度估算方法、EXPLAIN 与 Query Profile 等诊断工具的使用,以及索引下推与排序的执行流程等索引优化理论;最后结合日常实践经验,提出了适用于大规模线上集群的索引变更 SOP,并总结了常见的慢 SQL 成因与相应的解决策略。前言交易订单表(tcorder)用于存储集团电商的在线订单记录,该表近60个字段

2025-11-19 17:15:06 1057

原创 页面搭建方案(TurboUIBuilder)在穿搭星球的实践

本文介绍了手淘穿搭星球业务在面对快速迭代和极致用户体验需求时,从初期Weex方案转向Native技术栈,并基于微服务架构设计了TurboUIBuilder这一可视化页面搭建平台。该方案通过三层结构实现页面布局的结构化与动态化,结合DX动态组件、keypath数据绑定协议和内置核心服务(如布局、数据、埋点等),提升了开发效率30%-50%,实现了双端一致性、体验优化开箱即用(如无极缩放转场、多媒体浏览)以及页面的远程动态更新。同时,依托Skyline模板发布平台,支持高效、安全的模板管理与AB测试,最终形成了

2025-11-14 17:17:50 947

转载 从0到1:天猫AI测试用例生成的实践与突破

随着大模型的不断演进,测试行业基于AI也在做不同程度的探索,在agent智能体生成方面,基本使用的是prompt+RAG的方式,构建特定业务的需求分析/测试用例生成/数据构造智能体等。其中从用例设计到最终的回归约占据了QA 70%的时间,在当下对于质量要求高,版本节奏快,人力成本缩减的前提下,急需借助大模型来辅助测试设计,建设相关的智能化工具。目前在实践中主要问题还是集中在PRD质量不高;营销解决方案,导购场域,交易结算,多部门协作,中后台,如何针对不同业务类型做用例生成的适配和应用,也是面临的难题之一。

2025-11-10 17:57:07 226

原创 让AI打出丝滑连招:编码-部署-自测-改bug

在AI辅助编程的实践中,即使需求理解、方案设计、代码生成都很顺利,AI写出的代码仍不可避免地存在各种小问题。

2025-11-07 18:41:10 1095

转载 别让故障复盘流于形式:用AI挖掘每一次“跌倒”的价值

而复盘是让这次故障价值最大化的核心节点,一方面准确深度发现当前系统的风险,并推动当下系统存在的风险闭环解决,同时举一反三将未发生故障&存在同样风险的系统实现真正的故障规避,另一方面复盘的结果也应该作为一种数据资产在后续的稳定工作中产出更有实质性的帮助,比如丰富稳定性工作的方向和方式,再比如经验不足的研发可以从过去的故障中学习故障树FTA路径,以及恢复手段和关键决策。我们决定推翻标签限制的关注点生成架构,借鉴人工复盘思路,从五个域出发(架构,测试,编码,变更,应急),根据上下文先提出关键问题,再尝试回答。

2025-11-03 17:33:42 278

转载 AI Coding 长文分享:如何真正把工具用起来,从原理到实践

涵盖其底层机制(如Token计算、工具调用、Codebase索引与Merkle Tree)、提升对话质量的方法(如规则设置、渐进式开发)、实际应用场景(如代码检索、绘图生成、问题排查),并推荐了结合AI的编码最佳实践,包括文档、注释、命名规范和安全合规,旨在帮助不同经验水平的开发者真正把AI工具用好。我们不只可以粘代码、图片进去,还可以让模型参考网页、Git历史、当前打开的文件等,这些 IDE 类的工具支持的比较好,因为是在IDE环境里面,而CLI在终端中,限制就要多一些(但更灵活)。

2025-10-29 21:08:04 780

转载 我的研发实践:高准确率AICoding工作流设计

在Agent框架选择上,一般我们在IDE或者cli中直接使用的都是单一Agent,单一LLMAgent可以通过工具、记忆、规划执行,很好的完成我们诸如:代码变更的诉求,如果我们的工作流有且仅有代码修改时,这样的架构无疑是最高效的,但是,我们也必须看到单一 Agent 有几个问题:工具太多可能导致选择复杂,上下文变得过于庞大,以及任务可能需要专业化。技术是帮助业务解决问题的手段,业务的形态,技术的使用是多样的,但是沉淀解决问题的能力,抽象解决问题的方法是不会变的。应该是,你想让这个方向变成未来的趋势吗?

2025-10-27 17:22:40 772

转载 一次AI驱动的淘宝客户端需求开发实战

提供清晰和明确的prompt描述,在提供给AI Coding任务尽可能是你能预期输出,给出明确构建描述的任务,当你的Prompt不能指向一个明确的Coding 产物时,可能带来的就是无尽的再次沟通成本,带来的提效时长,在一次次反复补充信息中,逐渐消耗成0甚至不如我自己干了。尝试对收集中的问题,提供了一些解决的建议,截取如下。这样的开发方式,除了提升了Coding的效率,同时也能一定程度上降低客户端开发时,双端的不一致问题(逻辑差异,消息名不一致,技术方案差异等等),减少了方案不一致导致后需问题的可能性。

2025-10-22 18:48:17 229

原创 天猫行业中后台前端研发Agent设计

实践验证表明,这种策略带来了显著的投资回报:不仅实现了70%的代码查询延迟降低,系统的松耦合设计还确保了各组件的独立演进和优化能力。更严重的是API变更带来的认知偏差问题,已有工具的API可能已发生重大更新(如Tailwind CSS v4的breaking changes),模型对废弃方法和新增特性的把握存在准确性问题。无论是传统的VSCode、IntelliJ IDEA,还是新兴的AI增强型IDE如Cursor、Windsurf,它们的核心关注点依然停留在代码编写、调试和基础的智能提示层面。

2025-10-20 17:45:47 1757

转载 初探:从0开始的AI-Agent开发踩坑实录

作为决策者:让 AI 做决策,意味着它需要对环境有深刻的理解,甚至具备一定程度的“常识”,在已知的模型能力下,往往和高质量的prompt和上下文强相关。我们的任务,就是在理解这些工具的边界和特性的基础上,遇到问题,分析问题,并用最恰当的方式去解决问题。面对这种不确定性,需要更精细的策略,例如Few-short,即好的例子,清晰的逻辑链条和工具使用指南,迭代式优化等等。在那个瞬间,我脑海里闪过的一个宏大的图景——一个全能的应用部署agent,好吧冷静下来,还是聚焦于一个小的开始,k8s部署物的自动生成。

2025-10-15 18:19:47 272

原创 AI 动画辅助实现的方案与实践

通过AI驱动的精准推荐、场景化表达与动态策略调控,我们为用户创造更自然、更智能的购物旅程,为营销业务提供高效、敏捷的技术支撑,助力淘宝构建以用户为中心的全域营销技术体系。这两个工具将非结构化的视觉动画转化为可编程、高性能、易维护的前端实现,显著降低了开发门槛,使原本耗时数小时的动画开发流程缩短至几分钟,实现了从设计到代码的高效落地。基于 AI 技术自动生成并优化 SVG 动画代码,尤其针对路径变形、形变动画等复杂场景,实现关键帧间的平滑过渡,输出轻量、可维护的动画代码,大幅降低开发门槛。

2025-10-13 18:10:00 1177

转载 从Prompt到Context:为什么Think Tool是形式化的必然?

上面说的很多,其实重演了软件工程的历史,对可靠性、可验证性、可扩展性和可维护性的需求是完全相同的。这块的设计提升的效果非常的明显,在几个案例上都达到了明显的提效,甚至比R1的预先的思考更有效,这种玩法就是把思考这个行为从一种隐式的、不可观测的过程,转变为系统执行迹线中一个显式的、结构化的、可验证的动作。首先在这里说到的语言,并不是严格按照上面的谱系语言分级,也不是编程语言,这里指的是整个人类的自然语言,而这里的编译器指的是LLM,相当于是LLM来编译人类的语言产生结果,这之间自然是存在类似的形式化分级。

2025-10-09 16:57:36 170

原创 产品经理也能“开发”需求?淘宝信息流从需求到上线的AI端到端实践

每个代码仓库相关的资料,存放在代码仓库特定路径下的markdown文件,在任务执行过程中可选择特定的上下文,由代码的所有开发者共同维护,同样可适用于Cursor或Jules等编程工具,包含目录结构、仓库工作流、技术栈等。有了强大的一个AI编码工具Codex,也有了需要执行的任务(提示词),我们如何指挥大模型进行正确的修改呢?团队在保证业务的同时,以先进的跨端框架和研发模式不断完善自己,打造最极致的体验和工程技术,保障多端设备的适配和稳定运行,并探索端智能等创新机会,通过技术高效驱动业务的良性发展。

2025-09-29 16:49:24 1156

原创 一位淘宝工程同学的大模型LoRA微调尝试

通过AI驱动的精准推荐、场景化表达与动态策略调控,我们为用户创造更自然、更智能的购物旅程,为营销业务提供高效、敏捷的技术支撑,助力淘宝构建以用户为中心的全域营销技术体系。结果表明,LoRA 能以极低的计算成本让通用大模型有效学习业务知识,显著提升其在特定任务中的表现,真正实现“让大模型懂业务”,推动 AI 从“可用”走向“好用”。从智能客服到内容生成,从代码辅助到推荐系统,大模型正以前所未有的速度渗透到互联网技术的各个领域,成为驱动创新的核心引擎。),在不改变主干模型的前提下,仅通过训练少量新增参。

2025-09-24 16:35:52 637

转载 Claude Code 深度拆解:一个顶级AI编程工具的核心架构

整个Claude Code的核心资产,他这个cli效果这么好除了是因为强大的模型,也是因为有很强大的工具,例如有一个特别强大的bash tool的工具,可以调用shell里面的所有命令,也包含agent tool,可以发挥更强大的能力。际的使用过程中,Claude Code是一个比较通用的智能体,他输出的代码也比cursor简练很多,更像是一个熟悉整个项目的高级程序员,研究和学习这个框架对于开发自己的Agent至关重要,本篇文章会详细介绍Claude Code的设计模式和核心。

2025-09-22 16:47:38 656

原创 多模态AI质检:身份核验场景实践

针对用户上传身份证时常见的图片问题,项目通过引入阿里云百炼平台的多模态模型,在OCR识别失败时进行智能检测与反馈,提供对客友好的提示文案,从而引导用户重新上传合格照片。上线后,相关指标表现出积极变化,OCR失败用户的再次失败率(OCR失败用户中再次识别仍失败的比例)有所下降,申请转化率有所提升。将“珠海”识别为“上海”。通过大模型提示词的增强优化,无需对每个场景进行大规模定制,用于多种类型的证件上传场景即可快速扩展功能,为更多业务场景赋能,未来结合工作流或智能体编排,将进一步提升可维护性和功能扩展能力。

2025-09-17 17:42:41 1057

转载 基于智能体的自适应资损防控体系 - 淘工厂实践(二)

基于这些数据,Agent能够自动生成具体的监控建议,明确指出需要监控的具体对象、最佳监控时机、适用的监控类型,以及具体的监控值指标。正如我们在测试领域所践行的理念——"With great power comes great responsibility",当我们拥有了AI这样强大的工具,更应该思考如何用它来创造更大的价值,守护每一分应得的收益,为业务的健康发展保驾护航。”的问题,新范式中,我们的Agent结合上文智能化提取到的知识,对用户输入的“小程序-下单积分玩法”需求文档,展开分析。

2025-09-12 17:40:37 621

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除