阿里妈妈技术

阿里妈妈官方技术号,关于阿里妈妈的技术创新均呈现于此~ 欢迎关注

  • 博客(1290)
  • 收藏
  • 关注

原创 SIGIR‘26 | 多时间尺度轨迹自回归模型TAR,破解推广投放中的“粒度不匹配“难题

值得深入分析的是提升幅度的分布模式:在低预算(50%、75%)时提升最为显著(8.4%、13.5%),这是因为低预算下可赢得的曝光更少、转化更稀疏,粒度不匹配问题最严重,TAR 的多尺度机制优势最为突出;这一设计的精巧之处在于:动作序列作为状态轨迹的"一阶差分信息"被嵌入生成目标本身,使得从粗到细的轨迹生成天然包含了从粗到细的动作规划。这验证了论文的核心论点:多尺度生成在"反馈时间错位"场景中的价值更大——因为延迟反馈的本质就是信息在时间轴上的弥散,粗尺度观测天然"收纳"了这种弥散。

2026-05-28 18:01:00 370

原创 ACL’26 Oral|补齐LLM的“社交短板”!新框架首次将图数据作为监督信号,宏观微观全面对齐

值得注意的是,尽管基于 8B 参数 backbone,Graphia 在多个数据集上超越或媲美更大规模 LLM(如 Qwen3-32B、Llama3.1-70B)。它利用图数据作为LLM 后训练阶段的监督信息,并引入强化学习机制:基于图神经网络 (GNN) 的结构奖励来训练专门的智能体,使其能够预测与谁交互(目标选择)以及如何交互(边生成),然后通过预先设计的图生成流程进行操作。(2)结构奖励设计:引入更高阶拓扑属性(如社区凝聚、三元闭包)到奖励函数中,提升模型在不同图结构下的泛化能力。

2026-05-21 18:00:00 365

原创 让大模型自己学会拍卖!LLM-Auction将营销内容分配与自然回答生成合二为一

同时,定性的案例展示出:①相比预训练 LLM,LLM-Auction 对营销内容的分配有更好的语义匹配性,并会将营销内容自然融入回答叙事;Oracle版本的LLM-Auction的性能进一步预示了,随着效果预估模型精度的提升,LLM-Auction仍有可观的提升空间。LLM-Auction 将拍卖机制设计与 LLM 对齐技术结合,提出了首个统一分配与生成的基于学习的机制框架:通过偏好对齐让 LLM 自身成为分配规则,天然建模上下文外部性,并在不增加额外推理开销的情况下获得更高分配效率。

2026-05-14 18:01:13 571

原创 WWW’26 Oral | DARA:面向在线推广的小样本预算分配双阶段RL‑LLM框架

DARA 框架通过将预算分配任务拆分为小样本推理和精细化优化两个阶段,结合 RL 微调提升了 LLM 的数值推理能力,在在线推广预算规划中取得了显著效果。这是因为随着策略持续优化,当前策略与固定参考策略之间的分布差距越来越大,KL 正则化项会产生越来越强的"拉回力",将模型束缚在一个已经过时的基线附近,最终导致推理能力退化——这在预算分配这类需要多步精确数值计算的任务中尤为致命。算法 1 总结了双阶段协同的流程:首先通过小样本推理器生成初始预算,随后在每个周期内根据反馈调整预算,直到满足终止条件。

2026-05-07 18:13:57 363

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 546

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 322

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 590

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 649

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 601

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 542

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 648

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 339

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 410

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 269

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 396

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 521

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 304

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

在电商搜索场景中,用户的一次搜索往往同时触及商品的多个模态维度。以搜索"小香风外套"为例,系统不仅需要从商品主图中识别 "编织纹理" 与 "版型设计" 等关键元素,还需从商品文本中解析"羊毛"、"短款"、"春季新款"等关键属性,更需要综合判断图像与文本所描述的是否为同一件商品。这一过程的背后,折射出不同模态在信息表达上的天然互补性:图像直观呈现形态、颜色与设计元素,文本则更擅长承载品牌、材质、功能及适用场景等结构化语义,任何单一模态都仅能覆盖商品信息的部分维度,难以独立支撑精准的商品理解与匹配。然而真正加剧

2026-04-09 18:01:46 518

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 298

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 283

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 543

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 260

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 259

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 350

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 266

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 238

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 236

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 320

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 274

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 313

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 367

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 309

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 538

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 241

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 309

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 562

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 307

原创 面向Skills编程:用领域知识工程驱动 Code Agent

团队也使用 SDD 从零AI Coding编写了一个 4000+ 行的业务项目,效果不错——从 0 到 1 的项目,没有存量代码的历史包袱,spec 可以从头写起,不存在与现有代码脱节的问题。过时的知识比没有知识更危险——Code Agent 会带着错误的确定性去执行,并快速复制。当 Code Agent 为了实现需求而读取 Skill 知识文件,随后又查看实际代码时,如果发现知识描述与代码现状不一致,Agent 会在输出实现方案的同时,额外生成一份校验报告,标注不一致的严重程度、具体差异和修正建议。

2026-04-02 18:07:43 590

原创 WSDM’26|阿里妈妈直通车提出搜推广系统通用用户大模型LUM

支持基于 GPU 的 HNSW 等向量检索能力,具备多卡协同存储、检索、D2D 访问和 INT8 量化加速能力,实现向量召回与 LLM 推理的一体化闭环,减少 PCIe 传输和数据拷贝开销,进一步提升搜推广场景下的检索效率与在线推理性能。构建的——召回有召回的模型,预估有预估的模型,各自为战。反观搜推广预估模型,则走在一条不同的发展轨迹上。从FM/FFM的显式特征交叉,到DIN/DIEN的序列注意力建模,再到DeepFM/DCN的高阶交互,每一次突破都依赖针对特定信号设计的功能模块。

2026-03-26 18:00:59 421

原创 AAAI’26 Oral|Agent基于用户长期行为的个性化偏好理解的评估和优化

相比之下,PAL-Set是唯一同时包含行为日志与对话记录的用户-智能体交互数据集,每位用户平均28.9个会话、400.9轮对话,且所有交互均围绕同一用户的一致人设生成,更贴近真实的长期个性化交互场景。在这一蓬勃发展的浪潮中,Mem-PAL作为其中一种的一朵浪花,在基于长期行为的偏好对齐上,抛砖引玉。区别于传统的问答bot,Agent需要基于客户的当前状态、历史行为等记忆深度理解客户的个性化偏好,从而解决客户和投手的个性化营销优化问题,在此背景下,2024年末,AI小万算法同学在此方向展开探索。

2026-03-19 18:05:49 358

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除