• 博客(1222)
  • 收藏
  • 关注

原创 淘系技术,实力为2019年双11而战!稳!

今年,双11走到了第11个年头,史无前例的,阿里经济体内有49支技术团队共同参与作战,也是第一次,双11的核心系统将100%跑在云上,这无疑让今年的双11技术作战充满了更大的挑战。正如2019年双11技术团长平畴(汤兴)说的“「善战者,无智名,无勇功」,这是我们技术人最高的境界”。我们一起捍卫了阿里技术人的荣耀,一个字 “稳”!年年双11,回回新玩法,“在吗,盖楼吗?”成为了好友聊天的日常,每天蹲...

2019-11-12 00:38:06 21752 7

原创 serverless在点淘的质量保障实践

SERVERLESS能够将应用分为研发域和运维域,使两者独立迭代,降低运维成本,提升研发效率。点淘作为试点项目,经历了包括功能回归、压力测试和监控验证在内的质量保障流程,并在实践中遇到了各种问题,如依赖梳理、性能验证和监控建设等。文章还提到了SERVERLESS带来的部署效率提升,例如应用部署时长显著下降,并展望了未来通过基座插件化和分层自动化来进一步优化测试成本和功能保障。最后,文中列举了SER...

2024-05-22 17:01:25 518

转载 一个淘宝服务端工程师的年度总结

我们新推出大淘宝技术年度特刊《学如逆水行舟,不进则退——工程师2023年度成长总结专题》,专题收录10余篇工程师2023真诚心路历程与经验思考,覆盖终端、服务端、技术质量等技术领域,这是他们的心得体会,欢迎同行的你一起沟通交流。本文为该系列第二篇——第一篇:《聊聊我做测试开发的十年心路历程》服务端开发工程师天未2023年在大淘宝技术账号上发表了6篇文章,聊过技术干货,也聊过业务沉淀,还聊过个人思考...

2024-05-20 18:40:38 13

转载 生成式AI原理技术详解(二)——高级神经网络

本文主要介绍了生成式AI的相关技术,特别是卷积神经网络(CNN)在图像识别领域的应用。本文为该系列第二篇,第一篇:生成式AI原理技术详解(一)——神经网络与深度学习引言如果看明白了上一篇文章对神经网络和深度学习的介绍,再来逐步深入了解AI相关的概念和原理应该就相对容易了。希望上一篇文章能给大家一点印象:AI并没有想象中复杂。AI能处理海量信息,但是它并没有人类难以理解、异常复杂的机制。因为只有机制...

2024-05-17 17:40:14 9

转载 实战算法的基础入门

关于实战算法都需要了解哪些?一文带你详细了解,欢迎收藏!▐URL黑名单(布隆过滤器)100亿黑名单URL,每个64B,问这个黑名单要怎么存?判断一个URL是否在黑名单中散列表:如果把黑名单看成一个集合,将其存在hashmap中,貌似太大了,需要640G,明显不科学。布隆过滤器:它实际上是一个很长的二进制矢量和一系列随机映射函数。它可以用来判断一个元素是否在一个集合中。它的优势是只需要占用很小的...

2024-05-13 16:20:21 22

原创 面向电商家居行业3D室内场景合成中的空间感知

本文主要介绍了3D场景合成技术在电商领域,尤其是家居家装行业的应用。它解释了如何使用3D场景合成创建逼真的室内设计,让消费者能够交互式地查看和体验产品,提高购物的趣味性和效率。文章提到了两种主要的3D室内场景生成算法:传统方法和深度学习方法,并着重介绍了如何通过空间感知和物理约束、功能约束以及美学认知来优化家具布局。此外,文章还讨论了在3D场景中处理碰撞检测、漂浮问题、通行区域和家具访问空间的重要...

2024-05-10 16:30:23 479

转载 Java的基础入门

关于Java都需要了解哪些?一文带你详细了解,欢迎收藏!Java基础▐面向对象三大特性特性:封装、继承、多态;封装:对抽象的事物抽象化成一个对象,并对其对象的属性私有化,同时提供一些能被外界访问属性的方法;继承:子类扩展新的数据域或功能,并复用父类的属性与功能,单继承,多实现;多态:通过继承(多个⼦类对同⼀⽅法的重写)、也可以通过接⼝(实现接⼝并覆盖接⼝);Java与C++区别不同点:c++支...

2024-05-08 16:20:38 32

原创 如何优雅地编写缓存代码

在日常的编码实践中,经常会用到缓存来解决高并发问题,缓存可以说是解决流量洪峰的不二利器。虽然集团中间件团队已经构建了缓存的基础设施,已经帮助我们解决了绝大部分问题,但是在实际的编码使用过程中,应用端调用缓存API时还是存在下述几类问题:使用缓存的逻辑非常通用,基本都是先查缓存,有直接返回,没有查DB,再放入缓存中。这段通用逻辑散落在系统的各个地方,违反了高内聚低耦合的原则。缓存代码和业务逻辑代码深...

2024-04-29 16:21:02 6243 1

原创 diffusers SD推理加速方案的调研实践总结

近期,在我们的内容技术灵媒智算平台(MVAP)上部署的服务数量提升迅猛,部分业务场景对SD系列模型的推理速度有着一定的要求。因此,我们对当前较为流行的SD加速方式进行了调研与测试,并以AI试衣业务场景为例,尝试了多种加速方案。下面是对调研结果与实际落地效果的一些总结与分享。加速方案介绍目前主流的加速思路包含算子优化、模型编译、模型缓存、模型蒸馏等,下面将简要介绍一下几种测试中用到的有一定代表性的开...

2024-04-26 16:20:36 729

转载 LeetCode的基础入门

关于LeetCode都需要了解哪些?一文带你详细了解,欢迎收藏!Python语法reduce(function, iterable[, initializer]) reduce(lambda x,y:x * y,ns) # 数组之乘积 (ns[0] * ns[1]) * ns[2] reduce(lambda x,y:x + y,ns) # 数组之和# 记忆化搜索@functo...

2024-04-24 16:20:20 79

原创 生成式AI原理技术详解(一)——神经网络与深度学习

本文主要介绍了生成式AI的最新发展,提到了GPT-5和AI软件工程师在行业中的影响,指出AI技术进步对国家竞争和个人职业发展的潜在影响。未来已来最近有两则新闻:sam altman自曝GPT-5细节,公开宣称GPT-5提升将非常大,任何小看它的公司都会被碾压。并发推暗示OpenAI今年的产品会改变人类历史。关于首个AI软件工程师的新闻,里面AI软件工程师表现已经相当出众,具备了整体规划、DevOp...

2024-04-22 16:20:59 1026

原创 AI生图美学在淘宝的实践应用

本文介绍了如何制定和应用美学标准来评估和改善人工智能生成的图像质量,特别是在电商领域的应用,主要分为制定美学标准、训练美学模型、应用美学模型、升级淘宝风格模型四个步骤。美学的定义与分析图像质量标准:现代设计框架下,定义的图像质量标准基本是统一的。侧重技能和技法的定义,也由此延伸出对图、画、照片、影像的质量评判,再此基础上对成图手段的特性会有所要求和侧重。图像内容标准:意识形态下的表达好坏要求是广泛...

2024-04-19 16:20:49 1117 1

原创 基于LLM大模型Agent的适用范围和困境

本文提到大模型通常的工作方式,即通过提示词进行问答,并指出了两个主要问题:历史对话信息的管理和令牌数量的限制。文章讨论了知识库问答和个人助手两个应用场景,并分析了各自面临的困境,如知识库无法有效处理多模态信息和大型文档,个人助手则受限于工具参数的复杂性和令牌长度。文章还提到了微调(FINE-TUNING)作为改善模型性能的方法,以及在不同领域的应用潜力。最后,分享了对微调成为标准操作流程的预期,以...

2024-04-17 16:20:56 415

原创 一文讲明白什么是市场调研

本文主要介绍市场调研的主要步骤和工具方法,并简单介绍了淘宝在电商领域中市场调研的实践。什么是调研▐定义广义的含义,调研既是指市场调查,通过收集、分析和解释相关数据来达到了解企业现状、了解市场趋势、挖掘用户需求、确定产品研发方向等目的。市场调查的最终目的是制定一系列商业决策。▐常见研究目标了解目标市场:市场调研帮助企业更好地了解目标市场的规模、结构、增长趋势和关键参与者。这有助于企业确定在哪...

2024-04-15 16:20:41 1040

原创 高速服务框架HSF的基本原理

SOA解决方案——HSF(High-speedServiceFramework)是阿里系主要采用的服务框架,其目的是作为桥梁联通不同的业务系统,解耦系统之间的实现依赖。HSF简介▐背景单体应用的主要问题是不同的业务相互纠缠在一起,面对快速发展的业务,这种开发模型和架构不利于业务发展。为了解决这个问题,需要对应用进行拆分。将不同的业务分拆到多个应用中,让不同的应用分别承担不同的功能。在单体应...

2024-04-12 16:20:53 527

原创 Agent调研--19类Agent框架对比

代理(Agent)指能自主感知环境并采取行动实现目标的智能体,即AI作为一个人或一个组织的代表,进行某种特定行为和交易,降低一个人或组织的工作复杂程度,减少工作量和沟通成本。背景目前,我们在探索Agent的应用方向,借此机会调研学习了一下现在主流的Agent框架,这篇文章也是我们调研过程的记录。▐网络热门Agents截止至今日,开源的Agent应用可以说是百花齐放,文章也是挑选了热度和讨论度较...

2024-04-10 16:20:43 1464

转载 Netty的基础入门

关于Netty都需要了解哪些基础?一文带你详细了解,欢迎收藏!核心组件▐整体结构Core 核心层 Core 核心层是 Netty 最精华的内容,它提供了底层网络通信的通用抽象和实现,包括事件模型、通用API、支持零拷贝的 ByteBuf 等。Protocol Support 协议支持层 协议支持层基本上覆盖了主流协议的编解码实现,如 HTTP、Protobuf、WebSocket、二进制等主流...

2024-04-08 18:01:40 112

转载 实践总结|前端架构设计的一点考究

本文总结了作者在日常/大促业务的“敏捷”开发过程中产生的疑惑,并尝试做出思考得到一些解决思路和方案。在前端开发和实践过程中,梳理了一些简单设计方案可以缓解当时“头疼” 的几个敏捷迭代问题,并实践在项目迭代中。背景▐为什么会有这一篇文章?在日常/大促业务的“敏捷”开发过程中逐渐产生的几个疑惑,尝试地做出思考并想得到一些解决思路和方案。总的来说,在前端开发和实践过程中,梳理了一些简单设计方案可以...

2024-04-03 16:20:43 96

转载 C++从遗忘到入门

本文主要面向的是曾经学过、了解过C++的同学,旨在帮助这些同学唤醒C++的记忆,提升下自身的技术储备。如果之前完全没接触过C++,也可以整体了解下这门语言。面向受众本文主要面向的是曾经学过、了解过C++的同学,旨在帮助这些同学唤醒C++的记忆,提升下自身的技术储备。如果之前完全没接触过C++,也可以整体了解下这门语言。C++是一种通用编程语言,它被广泛用于软件开发。C++以其强大的功能、高效的...

2024-04-01 16:20:21 111

原创 大模型与数据分析:探索Text-to-SQL

当今大模型如此火热,作为一名数据同学,持续在关注LLM是如何应用在数据分析中的,也关注到很多公司推出了AI数智助手的产品,比如火山引擎数智平台VeDI—AI助手、 Kyligence Copilot AI数智助理、ThoughtSpot等,通过接入人工智能大模型,提升数据处理和查询分析的效率。智能数据分析助手,采用对话式分析技术,每个普通人都可以与数据进行随时随地的实时交互,根据用户的使用反馈,不...

2024-03-29 16:21:02 1584

原创 手动实现一个扩散模型DDPM

扩散模型是目前大部分AIGC生图模型的基座,其本质是用神经网络学习从高斯噪声逐步恢复图像的过程,本文用python代码从零开始构建了一个简单的扩散模型。理论部分DDPM(Denoising Diffusion Probabilistic Models) 是一种在生成对抗网络等技术的基础上发展起来的新型概率模型去噪扩散模型,与其他生成模型(如归一化流、GANs或VAEs)相比并不是那么复杂,DDPM...

2024-03-27 16:20:11 988

原创 52个AIGC视频生成算法模型介绍

基于Diffusion模型的AIGC生成算法日益火热,其中文生图,图生图等图像生成技术普遍成熟,很多算法从业者开始从事视频生成算法的研究和开发,原因是视频生成领域相对空白。AIGC视频算法发展现状从2023年开始,AIGC+视频的新算法层出不穷,其中最直接的是把图像方面的成果引入视频领域,并结合时序信息去生成具有连续性的视频。随着Sora的出现,视频生成的效果又再次上升了一个台阶,因此有必要将去年...

2024-03-25 16:20:51 2820 1

转载 JVM的基础入门

关于JVM都需要了解哪些基础?一文带你详细了解,欢迎收藏!JVM内存划分▐JVM运行时数据区域堆、方法区(元空间)、虚拟机栈、本地方法栈、程序计数器。Heap(堆)对象的实例以及数组的内存都是要在堆上进行分配的,堆是线程共享的一块区域,用来存放对象实例,也是垃圾回收(GC)的主要区域;开启逃逸分析后,某些未逃逸的对象可以通过标量替换的方式在栈中分配。堆细分:新生代、老年代,对于新生代又分为:E...

2024-03-22 17:20:55 163

原创 Java 22 新增利器: 使用 Java Stream Gather 优雅地处理流中的状态

本文我们分析了 什么 是 “流”,对比了 Java 上几种常见的 “流”库,引入和详细介绍了 Java 22 中的 Stream Gather API 。同时也简单分享了利用 虚拟线程 如何简化 StreammapConcurrent操作符的实现。背景Java Stream 自从 Java 1.8 引入以来,迅速成为了各位开发者手中信手拈来的工具,大家日常在工作中谈论起来也是如数家珍。但由于 Ja...

2024-03-20 16:20:54 662

原创 浅谈游戏地图中位置实时更新的技术方案

地图如今在游戏中发挥的作用越来越重要,随着电子竞技的兴起,地图逐渐成为了为玩家创造体验的直接舞台。希望本文能对有兴趣了解游戏地图背后实现原理的同学一些帮助。什么是游戏地图在游戏中可以通过3D场景虚拟一个完整的世界,当3D场景较为广阔和地形比较复杂时,游戏玩家在场景中漫游行走,往往容易因为陌生的环境而迷失方向。而通过为玩家提供一张场景地图,就可以以一种更加直观的形式向他们呈现整个游戏的世界观。游戏地...

2024-03-18 16:42:48 915

原创 常见 Java 代码缺陷及规避方式

在日常开发过程中,我们会碰到各种各样的代码缺陷或者 Bug,比如 NPE、 线程安全问题、异常处理等。这篇文章总结了一些常见的问题及应对方案,希望能帮助到大家。问题列表▐空指针异常NPE 或许是编程语言中最常见的问题,被 Null 的发明者托尼·霍尔(Tony Hoare)称之为十亿美元的错误。在 Java 中并没有内置的处理 Null 值的语法,但仍然存在一些相对优雅的方式能够帮助我们的规避...

2024-03-15 16:20:27 914

原创 淘宝人生2的AIGC技术应用——虚拟人写真算法技术方案

近几个月,随着基于Stable Diffusion的相关技术发展,基于参考图的角色定制化技术[1,2, 3, 4, 7]受到相关行业以及学者的广泛关注。其中,人像定制化是指:给定任务角色(参考图),通过提示词控制生成多样新的图像,并且图像中的人物身份信息和参考图保持一致。人像定制化生成技术可以分为1)基于角色LoRA训练以及2)基于注入图像特征两种方案。其中,基于LoRA训练的技术通过收集定制化人...

2024-03-13 16:30:56 1185

原创 如何优化淘宝直播 PC 推流端性能

基于 Electron 的淘宝直播 PC 推流端已经上线一年多,期间迭代了很多功能,应用也越来越庞大。自上线以来也收到一些用户反馈应用启动慢、打开推流页面慢、运行过程页面交互操作卡、推流画面卡、CPU 占用过高等性能问题。针对这些问题,我们要怎么优化呢?背景在开始讨论优化之前,我们先来了解下 Electron 是一个使用 JavaScript、HTML 和 CSS 构建 Windows、MacOS...

2024-03-11 16:20:18 1029

原创 现代布局方案在商品卡片中的应用实践

文章介绍了grid布局的应用场景,给出了学习路线,并附上了几个实现效果。推荐大家用起来~从一个需求案例说起▐背景商品卡片,是电商的经典场景。一个典型的商品卡片大概长这个样子:图源:天猫榜单商品卡片榜单商品卡片2商品卡片里通常有商品图、名称、价格、券、销量、行动按钮、利益点。除了这些,不同业务侧还会设计一些特殊表达。由于信息众多,布局上也往往比较复杂。▐传统布局传统实现上,使用 flex 端...

2024-03-08 16:21:02 897

原创 AIGC图像技术在淘宝人生2的探索和应用

淘宝人生2(又名:第二人生)是淘宝的一个虚拟人装扮类应用,承担了用户在淘宝的第二个人生的作用。我们旨在通过AI为淘宝人生2的用户提供丰富有趣的可玩性内容,随着最近火热的AIGC技术的发展,我们也进行了相关尝试和落地,目前已经上线了AI拍照风格化、AI写真馆、AI服饰涂鸦等项目。本文主要以AI服饰涂鸦为例介绍我们在AIGC图像领域的探索和应用,希望能够对大家有所启发和帮助,也欢迎大家建议和合作。项目...

2024-03-06 16:20:48 3080 1

原创 分类算法入门:以鸢尾花数据集为例

近两年人工智能技术蓬勃发展,OpenAI连续放出ChatGPT、Sora等“王炸”产品,大模型、AIGC等技术带来了革命性的提升,很多人认为人工智能将引领第四次工业革命。国内各大互联网公司也是重点投资布局,从个人角度来说要尽快跟上时代的潮流,有一句话说得好,“未来,淘汰你的不是AI,而是那些懂得运用AI的人!”。我们的初衷是从热火朝天的技术浪潮中回归冷静,深入理解和跟进AI技术的发展动态,并通过一...

2024-03-04 16:20:48 1285

原创 聊聊我做测试开发的十年心路历程

我们新推出大淘宝技术年度特刊《学如逆水行舟,不进则退——工程师2023年度成长总结专题》,专题收录10余篇工程师2023真诚心路历程与经验思考,覆盖终端、服务端、技术质量等技术领域,这是他们的心得体会,欢迎同行的你一起沟通交流。作者天士从事测试开发十多年,期间经历不少角色转换,以下是他在测开成长升级、质量体系建设、专项建设方面的总结,以及职场上的一些思考。引言不知不知觉,已经从事测试开发这个行当1...

2024-03-01 16:20:55 651

原创 什么样才算好图——从生图模型质量度量方法看模型能力的发展

本文总结了近10年来的生图模型论文中用到的评价指标,并尝试解答两个问题不同时期的评价标准都有哪些特点?图片质量的评价如何辅助模型的迭代?前言随着各种文生图模型逐渐从toy project进入到生产链路,在线上实际落地并产生业务价值,同时自研/来源模型也进入了快速迭代的阶段。一套直指问题、综合拓展性和复用性的评价指标变得尤为宝贵,从效果上来讲,如果说数据质量决定了模型效果的上限,那么指标的好坏直接决...

2024-02-28 16:21:02 1028

原创 如何用SVG画一个特定边框

最近的需求中有一个tab切换的场景,设计师提出了自己期望的效果,核心关注点在蓝色边框上,本文围绕如何实现这样的边框效果展开讨论。背景设计师期望的效果如下,核心关注点在蓝色边框上。实现这样的边框,核心问题有几个:如何将两个元素的边框相连内凹的圆角如何实现tab元素滚动离屏,边框如何过渡CSS我决定先用CSS试试,border + border-radius,应该轻松搞定。▐问题一:CSS 如何实...

2024-02-26 16:21:00 2622

转载 淘宝设计2023年度AI设计实践报告

22年中,绘制头像还在用3D进行建模,到了年末,就已经用AI直接生成了。22年末,面对AI工具设想能不能在我们业务中进行尝试,到了23年中,AI工具已经覆盖我们团队所承接的所有营销场景业务。23年初,团队同学讲到AI工具的应用时觉得这是一个专业亮点,到了23年末,AI工具已成为我们团队设计师的基础能力。这一切,都变的太快。这一年,也积累了些心得。首先AI工具带来降本增效,让我们的创意效果快速产生,...

2024-02-23 16:20:39 491

原创 LangChain原理学习笔记

最新越发觉得AI的发展,对未来是一场革命,LangChain已经在工程设计上有了最佳实践,类似于AI时代的编程模型或编程框架,有点Spring框架的意思。之前在LangChain上也有些最佳实践,所以在这里分享记录下。LangChain解决什么问题LangChain是基于LLM之上的,在应用层和底层LLM之前的一个很好的编程框架,如果把LLM比喻为各种类型的数据库、中间件等这些基础设施,应用层是各...

2024-02-21 17:01:10 1609

转载 淘天业务技术2023年度热门文章盘点

写给工程师的 MacBook 商用级大模型知识库部署方案LLM在电商推荐系统的探索与实践聊聊我在淘宝做性能分析的经历DDD之于业务支撑的意义负责淘宝业务前端开发9年,聊聊我的心得慢SQL治理经验总结LangChain: 大语言模型的新篇章在淘宝,商品技术团队每天都在干什么?基于Stable Diffusion的AIGC服饰穿搭实践如何在业务代码中优雅地使用责任链模式¤拓展阅读¤3DXR技术|...

2024-02-19 13:11:50 420

转载 十行代码让日志存储降低80%

日志是系统中熵增最快的一个模块,它承载了业务野蛮生长过程中的所有副产品。本文介绍了一个日志治理案例,围绕降本和提效两大主题,取得一定成效,分享给所有渴望造物乐趣的同学。前言履约管理是一个面向物流商家的OMS工作台,自从初代目把架子搭起来之后,就没有继续投入了,后来一直是合作伙伴同学在负责日常维护和需求支撑。经过几年的野蛮生长,系统已经杂草丛生,乱象百出。再后来,甚至一度成为一块无主之地,走行业共建...

2024-02-07 16:20:54 653

转载 一文带你揭秘淘宝终端技术

在这个数字化迅速发展的时代,技术的每一次飞跃都不仅仅意味着一个产品的升级,更是对未来世界的一次大胆想象。从PC到iPhone,从Model 3到ChatGPT,都引领了全新的一个行业。对于正处在求学阶段的你们,选择一个充满活力、技术领先、并且可以提供巨大成长空间的团队,无疑是迈向成功职业生涯的关键第一步。现在,就让我们一同揭开淘天终端技术团队的神秘面纱,一步步为你揭晓为何我们在终端技术领域独树一帜...

2024-02-05 16:20:42 651

原创 【2023总结】天猫国际自营贴纸系统的焕新之路

商品主图在淘宝的各类导购渠道中(如搜索结果页、推荐列表、商品详情页等)至关重要,是向消费者表达商品信息的重要窗口,好的主图可以帮助消费者快速了解商品特性,加速购买决策,从而产生转化。前言天猫国际自营业务的商品主图由商品主体,价格与优惠,产品卖点,国际自营心智等元素组成,主图运营工作是一项多方协作的任务,涉及阿里内部运营团队(阿里小二)、供应商、用户体验设计团队(UED)、产技团队及主图系统,主要分...

2024-02-02 16:20:54 876

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除