阿里妈妈技术-CSDN博客

原创 25届秋招同学专属 | 妈妈技术&淘天算法技术OpenDay，欢迎报名入园交流

2024-07-15 19:20:54 127

原创 KDD'24 | 合约广告中大规模多重线性约束库存分配问题的高效局部搜索算法

▐ 摘要合约广告（Guaranteed Delivery Advertising）是在线广告的重要组成部分，合理的合约库存分配机制直接提升客户需求和平台收入。随着广告客户需求的越来越多样化和精细化，在业务场景中经常出现媒体偏好需求，即适合投放在指定媒体的广告在该媒体上分配的比例应该大于另一些不适合在该媒体投放的广告。然而，这些需求涉及到非凸的多重线性约束，会给合约广告的库存分配带来挑战，而数学规划...

2024-07-11 21:08:23 301

原创 CausalMMM：基于因果结构学习的营销组合建模

1. 摘要在线广告中，营销组合建模（Marketing Mix Modeling，MMM）被用于预测广告商家的总商品交易量（GMV），并帮助决策者调整各种广告渠道的预算分配。传统的基于回归技术的MMM方法在复杂营销场景下效果不尽如人意。尽管一些研究尝试使用因果结构进行更好的预测，但它们有一个严格的限制，即因果结构是事先已知且不可改变的。在本文中，我们定义了一个新的因果MMM问题，以自动从数据中发...

2024-06-21 18:30:25 1115

原创展示广告预估模型优势特征应用实践

1. 简介本文介绍阿里妈妈展示广告Rank团队对优势特征的应用实践。优势特征是指预估模型在线无法获取但离线能用于提升模型能力的特征。一种经典的优势特征使用方法是优势特征蒸馏（PFD）[1,2]：PFD方法使用全部特征（包括优势特征）来训练教师模型，然后利用以非优势特征（离在线均可得的常规特征）为输入的学生模型蒸馏教师模型能力，并用于在线打分。对于预估模型，我们通常会使用准度和排序能力来作为评价指标...

2024-06-13 19:00:12 930

原创展示广告多模态召回模型：混合模态专家模型

✍???? 本文作者：俊广、卓立、凌潼、青萤1. 背景随着在搜索、推荐、广告技术上多年的迭代积累，业界逐步形成了召回（匹配）、粗排、精排这一多阶段的系统架构。其中，召回作为链路的最前端，决定了业务效果的天花板。召回阶段的主要目的是从全量广告库中高效筛选高质量top-k集合给后链路进一步打分&排序。近年来，随着机器学习，尤其是深度学习技术的发展，学术界及工业界已经全面进入到了 model-base...

2024-05-29 19:00:36 940

原创阿里妈妈技术团队4篇论文入选 KDD 2024

近日，国际知识发现与数据挖掘大会 (ACM SIGKDD Conference on Knowledge Discovery and Data Mining，简称 KDD) 论文接收结果公布，阿里妈妈技术团队有4篇论文被录用。KDD 2024 是中国计算机学会（CCF）推荐的A类国际学术会议，也是数据挖掘领域的顶级会议，今年将于8月25-29日在西班牙巴塞罗那召开。本届会议 Research Tr...

2024-05-29 19:00:36 1071

原创筑基砥柱：EcomXL-万相实验室AIGC电商基础模型

✍???? 本文作者：顾知、岁星、天扉、佳玏、允行一、背景随着生成式技术浪潮的兴起，Stable Diffusion结合Controlnet等控制能力在电商场景得到了广泛的应用，其中制作一张优秀的商品主图（亦或是广告的创意图，以下简称商品图）对商品的点击转化有着重要影响，商家往往需要投入不少时间和资金成本。如何通过AIGC能力来帮助商家节省成本、提高制作效率和投放效果是阿里妈妈万相实验室的初衷。随着20...

2024-05-15 19:02:39 1262

原创百变背景：万相实验室AIGC电商图片可控生成技术

✍???? 本文作者：云芑、因尘、岁星、也鹿1. 背景随着AI生成内容（AIGC）技术如Diffusion的飞速进展，现如今，大家已能够轻易地使用Stable Diffusion（SD）[1]等文生图的模型或工具，将心中所想仅凭语言描述（prompt）即转化为具体图像。基于此，我们不禁思考：是否有可能进一步发展该技术，允许用户通过描述来为商品定制特定背景，从而协助商家快速且轻松地打造理想的商品图像？例如...

2024-04-24 19:31:35 1119

原创乘风破浪，川流入海 —— LLM在阿里妈妈智能文案的应用

1.引言在现代广告系统中，文案是不可或缺的一部分，几乎参与了广告素材的各个地方。随着NLP技术的极速发展，广告主逐渐学会并习惯使用文案生成工具直接或者间接的参与到广告的制作中，这为NLP技术在广告场景的应用提供了巨大的潜力和机会。阿里妈妈智能创作与AI应用团队在广告文案方面做了长期的工作，并积累的一定的技术能力。图1：智能文案应用场景举例2022年底，ChatGPT的横空出世，为NLP技术的发展的...

2024-04-17 21:21:07 879

原创尺寸魔方：AIGC赋能下的视觉创意智能延展

1. 概述在当今数字化营销时代，适配各种展示平台的视觉内容呈现成为了一项挑战。随着扩散模型等生成式模型的革新，生成式AI技术在图像和视频领域取得了显著的进步。特别是 Stable Diffusion (SD) 模型的发展，使得能够创造出符合各种风格的高品质、逼真的视觉作品。在这个背景下，视觉延展 (Outpainting) 技术显得格外重要，它能够扩展图像或视频的边界，以匹配不同的显示比例和尺寸需...

2024-04-10 20:45:09 800

原创 AI生成存储基座：自研超大规模向量数据库 Dolphin VectorDB

一、业务背景随着以OpenAI为代表的AI生成式技术不断突破，在万物皆可向量化的时代直接带动向量计算和存储需求大幅提升，让向量存储和计算技术关注度达到新高，业界涌现出各类向量数据库。阿里妈妈拥有丰富的AI应用场景，我们基于过去在向量引擎的积累和AI场景下需求，在近五年时间里不断迭代升级，沉淀出Dolphin VectorDB，具有大规模、高性能、低成本且易开发的优势，在妈妈内容风控、营销知识问答、...

2024-03-20 19:00:42 1164

原创 AtomoVideo：AIGC赋能下的电商视频动效生成

✍???? 本文作者：凌潼、依竹、桅桔、逾溪1. 概述当今电商领域，内容营销的形式正日趋多样化，视频内容以其生动鲜明的视觉体验和迅捷高效的信息传播能力，为商家创造了新的机遇。消费者对视频内容的偏好驱动了视频创意供给的持续增长，视觉内容作为连接消费者和商品的桥梁，在广告系统中正变得日益重要。然而，与传统的图文内容相比，视频内容的制作难度和成本都要高得多。制作一个高质量的视频需要专业的技能、设备以及时间，这...

2024-03-14 19:00:28 2115

原创合约广告中基于风险约束的Pacing算法优化

摘要：本文提出一种适用于合约保量广告的预算平滑Pacing算法，该算法通过对偶出价因子的百分位位置联动调控Pacing，兼容保量分配机制的同时，有效控制了预算释放过快的风险，并且最大程度兼顾了投放效果的提升。基于该项工作整理的论文已发表在AAAI'24，欢迎阅读交流。论文：Percentile Risk-Constrained Budget Pacing for Guaranteed Displa...

2024-03-06 19:50:46 531

原创阿里妈妈营销隐私计算平台SDH：公用云应用案例分享

一、概览阿里妈妈营销隐私计算平台Secure Data Hub（以下简称“SDH”）是一个面向广告引擎、广告主、三方DSP/DMP等合作方，在隐私安全环境下进行数据融合、隐私计算、联合建模的 Data Clean Room 产品（延展阅读：阿里妈妈营销隐私计算平台SDH在公用云的落地实践）。SDH利用多方安全计算、联邦学习、差分隐私等隐私增强计算技术，解决广告营销场景中数据孤岛和跨域数据流通问题。...

2024-02-29 19:00:34 634

原创开放下载 | 2023 阿里妈妈技术年刊来啦！

新春将至，一年一度阿里妈妈技术年刊也如约到来啦~2021 年 5 月，我们开始通过「阿里妈妈技术」微信公众号持续分享我们的技术实践与经验，覆盖广告算法实践、AI 平台及工程引擎、智能创意、风控、数据科学等多个方向。每年此时，我们都会整理过去一年颇具表性和创新性的工作沉淀制作成册，作为“新年礼物”送给大家。《2023阿里妈妈技术年刊》收录38篇文章，涵盖机制策略、预估模型、召回匹配、智能创意、...

2024-02-02 09:00:12 438

原创视频尺寸魔方：分层遮掩3D扩散模型在视频尺寸延展的应用

▐ 摘要视频延展(Video Outpainting)是对视频的边界进行扩展的任务。与图像延展不同，视频延展需要考虑到填充区域的时序一致性，这使得问题更具挑战性。在本文中，我们介绍了一个新颖的基于扩散模型的视频尺寸延展方法——分层遮掩3D扩散模型(Hierarchical Masked 3D Diffusion Model, M3DDM)。通过遮掩建模的训练方法以及把全局视频片段引入交叉注意力层，...

2024-01-24 19:08:05 1494

原创请查收 | 2023 阿里妈妈技术热门文章

新年伊始，万象更新！感谢过去一年每位读者朋友的支持与关注本期为大家带来2023年度阿里妈妈技术最受欢迎的10篇文章，欢迎阅读&收藏。愿大家常读常新，常有收获~新的一年，期待与大家以蓬勃向上的朝气共同进步，以精益求精的匠心稳健成长！01.阿里妈妈广告智能决策技术（自动出价&拍卖机制设计）的演进之路???? 随着智能化营销产品和机器学习的发展，阿里妈妈将深度学习和强化学习等AI技术越来越多...

2024-01-03 09:00:48 527

原创阿里妈妈营销隐私计算平台SDH在公用云的落地实践

一、概览如何在营销场景下安全合规的使用数据，维护在线广告商业模型的核心运作，成为当下广告生态中各企业亟需解决的问题。阿里妈妈一直注重对于隐私数据的安全合规使用，最大限度地保护用户隐私和数据安全。继上篇分享阿里妈妈营销隐私计算平台Secure Data Hub（以下简称“SDH”）在集团生产环境的技术方案后（延展阅读：广告营销场景下的隐私计算实践：阿里妈妈营销隐私计算平台SDH），本篇分享阿里妈妈营...

2023-12-21 19:01:11 945

原创大模型时代的阿里妈妈内容风控基础服务体系建设

???? 本文作者：御医、陌奈、列宁、陌瑶、加木、吉多一、内容风控业务背景及挑战1.1 业务背景内容作为营销的重要载体，能够促进信息的交流和传播。在营销场景中，广告高曝光的特性放大了风险外漏带来的一系列问题，少数用户为了引流获利，可能会发布一些涉嫌违规内容，也存在部分用户对广告法的理解存在偏差，误发布涉嫌违规内容。对于发布平台而言，如果这些内容确实违反法律法规，将会影响用户对平台的正面评价。因此，阿里妈...

2023-12-14 19:01:25 713

原创 NeurIPS 2023 | RGIB：对抗双边图噪声的鲁棒图学习

▐ 摘要链接预测[1,2]是图学习的一种基础任务，用于判断图中的两个节点是否可能相连，被广泛应用于药物发现、知识图谱补全和在线问答等实际场景。尽管图神经网络（Graph Neural Network，GNN）在该问题的性能上取得了显著进步，但在图结构噪声下的差强人意的鲁棒性仍是当前深度图模型的实际瓶颈。在鲁棒图学习方面，早期工作探索了通过邻近节点的平滑效果来提高GNN在节点标签噪声下的鲁棒性，其他...

2023-11-22 19:00:08 467 2

原创 HC^2：基于混合对比学习的多场景广告预估建模

1. 摘要多场景广告预估建模旨在利用多场景的数据来训练统一的预估模型，以提高各个场景的效果。尽管现有研究方法在推荐/广告领域已取得了不错的提效，但现有的建模方式仍然缺乏跨场景关系的考虑，从而导致模型学习能力的限制和场景间相互关系建模的困难。在本文中，我们提出了一种用于多场景广告预估建模的混合对比学习方法HC^2。为增强跨场景数据相互关系的建模，我们精心设计了一种混合对比学习方法来协助模型捕获多个场...

2023-11-15 19:01:01 500

原创自动出价下机制设计系列 (二) ：面向私有约束的激励兼容机制设计

自动出价已经成为在线广告拍卖的流行范式。不同于传统的手动竞价，自动出价中的广告主在一个周期内对多次广告拍卖进行累积的广告效果评估，并且拥有私有的经济约束。基于这些新的特点，我们考虑了适用于自动出价的拍卖模型：广告主将预算和投资回报率（ROI）等经济约束作为私有信息，且优化长期累积的广告效果。我们针对这种多维设定，从私有约束的角度推导了激励兼容的条件，并展示了任何可行的分配规则都可等效地简化为关于预算的一系列非递减函数。

2023-11-07 17:19:20 248

原创 BOMGraph：基于统一图神经网络的电商多场景召回方法

1. 摘要手机淘宝支持用户以多种形式来进行搜索，除了常用的文本搜索，还支持拍照搜索、相似商品搜索。不同场景之间在数据分布上存在许多共性和差异性。能否利用场景之间的共性来缓解单场景样本稀疏性问题，提升召回效果，同时避免统一建模对于各场景差异化建模的影响。因此，本文提出了一种统一的基于图神经网络的召回方法（BOosting Multiscenario E-commerce Search with a ...

2023-11-01 19:02:39 250

原创 MiRO：面向对抗环境下约束竞价的策略优化框架

本文分享阿里妈妈外投算法团队在黑盒对抗环境下的约束竞价问题上的探索。该工作已经发表在KDD2023，欢迎阅读交流。论文：Adversarial Constrained Bidding via Minimax Regret Optimization with Causality-Aware Reinforcement Learning下载（点击↓阅读原文）：https://arxiv.org/abs...

2023-10-11 19:04:01 324

原创 Memorization Discrepancy：利用模型动态信息发现累积性注毒攻击

本文分享阿里妈妈外投算法团队与香港浸会大学可信赖机器学习和推理组（HKBU TMLR Group）合作在理论与实践上探索外投广告媒体等复杂场景下应对噪声信号进行模型训练的问题。基于该项工作总结的论文已发表在ICML 2023，欢迎阅读交流。▐摘要近期研究表明，对抗性注毒攻击（Poisoning attack）对各类机器学习应用会构成巨大威胁 [1,2]。有别于之前研究所关注的线下注毒设定，累积性...

2023-09-20 19:00:40 119

原创 KDD'23 | CC-GNN：基于内容协同图神经网络的电商召回方法

1.摘要在电商搜索系统中，普遍流行用图神经网络来做商品召回。这些模型效果虽然很好，但仍存在以下不足：1）没有充分利用商品的图文内容特征；2）在工业级大规模稀疏图结构上的训练效率不高；3）对于长尾查询和冷启动商品的预测不够准确。为了解决这些问题，本文提出了一种新型的基于内容协同的图神经网络（Content Collaborative Graph Neural Network, 以下简称 CC-GNN...

2023-09-12 16:15:37 399 1

原创 KDD'23 | Score-Weighted VCG：考虑外部性的智能拍卖机制设计

1. 摘要智能广告拍卖机制（Learning-based Ad Auction Design）在在线广告中扮演着越来越重要的角色。但现有的方法并没有很好的考虑外部性，如自然结果会影响到广告结果的点击率。在本文中，我们提出了一种考虑外部性的广告拍卖通用框架，即 Score-Weighted VCG。该框架将考虑外部性的最优拍卖设计分解为两部分：单调得分函数的学习和加权福利最大化分配算法的设计。我们通...

2023-09-06 19:30:51 247

原创 KDD'23 | 强化学习在广告延迟曝光情形下的保量策略中的应用

本文分享阿里妈妈外投广告UD效果&用增算法团队针对广告延迟曝光问题通过强化学习 pacing 策略来完成曝光保量等各类业务目标的算法实践，相关技术方案已总结为论文发表在 KDD 2023，欢迎阅读交流。论文：RLTP: Reinforcement Learning to Pace for Delayed Impression Modeling in Preloaded Ads链接（点击↓阅...

2023-08-23 19:01:02 218

原创 KDD'23 | PerBid：在线广告个性化自动出价框架

导读：出价产品智能化成为行业发展趋势，自动出价（Auto-bidding）已成为互联网广告主营销的主流，大商家数据量大往往在统一模型中更占优势，为提升中小商家效果，我们开启探索“千店千模”之路。摘要随着深度学习技术的发展，广告平台推出了多样化的自动出价服务，协助广告主实现智能决策。然而由于不同的广告主往往处于具有极强异质性的广告投放环境中，因此当前广泛采用的“使用统一自动出价策略服务全体广告主”的...

2023-08-16 19:00:14 429

原创 MAX-Code首届阿里妈妈极限代码挑战赛圆满落幕，奖项揭晓！

MAX-Code首届阿里妈妈极限代码挑战赛圆满收官！大赛依托阿里妈妈真实广告业务场景，聚焦实际工程问题，分为AI赛道和引擎赛道，AI赛道聚焦机器学习推理服务的性能优化，引擎赛道聚焦真实场景的广告检索引擎构建，让选手们可以在比赛过程中身临其境地感受真实广告场景的魅力。自4月24日启动报名以来，吸引了海内外超过1100支参赛队伍报名，选手们经过初赛、复赛的角逐与挑战，历经91天，最终有20支参赛队伍...

2023-08-09 19:05:46 141

原创阿里妈妈技术团队8篇论文入选 CIKM 2023

近日，第32届国际计算机学会信息与知识管理大会（The 32th ACM International Conference on Information and Knowledge Management, CIKM 2023）论文接收结果公布。阿里妈妈技术团队8篇论文被录用。本文为大家介绍阿里妈妈技术团队入选论文，后续我们也将邀请作者详细解析论文思路和技术成果，欢迎关注~▐ Deep Task-...

2023-08-09 19:05:46 302

原创 KDD'23 | 合约广告中端到端流量预估与库存分配

导读：传统的合约广告售卖系统将流量预估和库存分配视为两个独立的模块两阶段求解，本文采用可微拉格朗日求解器，以新的端到端建模视角重新看待这一问题。▐ 摘要合约广告（Guaranteed Delivery Advertising）需要平台提前数周与广告客户签订合同，承诺提供广告展示次数并满足广告客户的定向要求。因此对于合约广告来说，除了投中分配策略，投前广告售卖技术也同样重要。传统的合约售卖技术将流...

2023-08-09 19:05:46 309

原创 AdaSparse: 自适应稀疏网络的多场景CTR预估建模

▐ 摘要CTR(Click-through rate)预估一直是推荐/广告领域重要技术之一。近年来，通过统一模型来服务多个场景的预估建模已被证明是一种有效的手段。当前多场景预估技术面临的挑战主要来自两方面：1）跨场景泛化能力：尤其对稀疏场景；2）计算复杂度：在线计算和存储资源有限情况下如何实现多场景模型构建。针对这两个挑战，本文提出AdaSparse，一种通过自适应学习稀疏网络的方法来实现多场景C...

2023-05-10 19:00:40 935

原创增广拍卖——二跳页下的拍卖机制探索

1. 引言本文提出的方案已被WSDM 2023接收，论文：Boosting Advertising Space: Designing Ad Auctions for Augment Advertising，下载：https://dl.acm.org/doi/abs/10.1145/3539597.3570381信息流产品为了保障用户体验通常会严格限制信息流中的广告曝光占比。稀缺的广告展示坑位难以满...

2023-04-19 19:00:37 684

原创 Auction Design in the Auto-bidding World系列一：面向异质目标函数广告主的拍卖机制设计...

导读：传统拍卖机制不存在了！出价产品智能化成为行业发展趋势，自动出价（Auto-bidding）已成为互联网广告主营销的主流，经典效用最大化模型（Utility Maximizer）的假设已经不再能良好地刻画此类广告主，传统拍卖机制在Auto-bidding下的激励性质和最优性需要被重新思考。▐摘要数字广告是互联网平台的主要收入来源之一。近年来，很多广告主开始采用自动竞价（Auto-biddi...

2023-04-12 19:00:10 839

原创 Bidding模型训练新范式：阿里妈妈生成式出价模型（AIGB）详解

其中，在营销层，革新了以往功能繁多操作麻烦的BP，给广告主带来一种新的对话式交互体验，广告主只需要通过简单的自然语言的描述，即可实现全部的营销流程，大大简化了广告主的操作和学习成本。，现实环境中的竞价环境是非常复杂且动态变化的，只控制预算无法满足更多样的出价计划的进一步优化。AlphaGo的惊艳表现，展现了强化学习的力量，而自动出价是一个非常典型的序列决策问题，在预算周期内，前面花的好不好会影响到后面的出价决策，而这正是强化学习的强项，因此第二阶段我们用了基于强化学习的Bidding。

2023-04-04 10:29:43 1168

原创 Bidding模型训练新范式：阿里妈妈生成式出价模型（AIGB）详解

导读：今天以ChatGPT为代表的生成式大模型让科技行业重新兴奋起来，也为广告营销注入了新的想象力。生成式大模型几乎一定会带来用户与互联网产品交互模式的改变，进而颠覆广告营销模式。广告技术人，你们准备好了吗？阿里妈妈技术已提前在该方向布局，并推出了新的广告营销智能技术体系，今天将揭露出其神秘面纱的一角，窥探背后的思考和实践。▐ 摘要出价产品智能化成为行业趋势，极简产品背后则是强大的自动出价的支撑，...

2023-04-03 19:02:16 1075

原创万字长文，漫谈广告技术中的拍卖机制设计（经典篇）

本文尝试将拍卖机制的几个经典问题做脉络性梳理，重点阐述概念之间的演进关系。希望可以勾勒清楚技术全貌，有助于大家系统性地认识计算广告领域的拍卖机制设计。丨目录： 1.初识广告拍卖机制和相关博弈论基础知识 2.社会福利最大化的有效机制3.平台营收最大化的最优机制4.经典广告拍卖基本框架和预告进阶篇5.参考文献搜索、推荐和广告在过去几年互联网蓬勃发展的浪潮中起到了核心助推引擎的作用，三者技...

2023-03-29 19:00:43 1053 1

原创阿里妈妈智能诊断工程能力建设

丨本文作者：茂道、羲洋、君之、天柏1. 业务背景算法同学在日常工作中经常要面临一些耗时较多的临时工单，这类工单的问题类型五花八门，背后对应的原因也各不相同，例如广告主操作类问题、大盘流量波动问题、海选问题、粗排问题等。这类Case每次都需要耗费较长时间单独解决，没有办法沉淀相应的工具和知识体系，随之带来的是算法团队开发诊断代码工作量大、开发周期长、不宜维护等问题。为了有效地持续提升工单处理效率，算...

2023-03-22 18:00:28 600

原创代码开源！阿里妈妈展示广告Match底层技术架构最新进展

一、背景大规模信息检索一直是搜推广领域的核心问题之一，而基于任意复杂模型的检索方案无疑是业界重要的迭代方向之一。近年来，阿里妈妈展示广告Match团队与预测引擎团队专注于从算法与工程角度推动工业级大规模检索技术的研发，我们在基于任意复杂模型的检索方向上积累了一定经验并取得了不错的业务效果，现整理发布NANN（Neural Approximate Nearest Neighbor，以下简称NANN）...

2023-03-14 19:00:14 327

空空如也

空空如也