阿里妈妈技术

阿里妈妈官方技术号,关于阿里妈妈的技术创新均呈现于此~ 欢迎关注

  • 博客(1287)
  • 收藏
  • 关注

原创 WWW’26 Oral | DARA:面向在线推广的小样本预算分配双阶段RL‑LLM框架

DARA 框架通过将预算分配任务拆分为小样本推理和精细化优化两个阶段,结合 RL 微调提升了 LLM 的数值推理能力,在在线推广预算规划中取得了显著效果。这是因为随着策略持续优化,当前策略与固定参考策略之间的分布差距越来越大,KL 正则化项会产生越来越强的"拉回力",将模型束缚在一个已经过时的基线附近,最终导致推理能力退化——这在预算分配这类需要多步精确数值计算的任务中尤为致命。算法 1 总结了双阶段协同的流程:首先通过小样本推理器生成初始预算,随后在每个周期内根据反馈调整预算,直到满足终止条件。

2026-05-07 18:13:57 322

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 525

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 301

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 567

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 630

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 574

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 518

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 608

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 298

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 375

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 248

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 358

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 497

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 277

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

在电商搜索场景中,用户的一次搜索往往同时触及商品的多个模态维度。以搜索"小香风外套"为例,系统不仅需要从商品主图中识别 "编织纹理" 与 "版型设计" 等关键元素,还需从商品文本中解析"羊毛"、"短款"、"春季新款"等关键属性,更需要综合判断图像与文本所描述的是否为同一件商品。这一过程的背后,折射出不同模态在信息表达上的天然互补性:图像直观呈现形态、颜色与设计元素,文本则更擅长承载品牌、材质、功能及适用场景等结构化语义,任何单一模态都仅能覆盖商品信息的部分维度,难以独立支撑精准的商品理解与匹配。然而真正加剧

2026-04-09 18:01:46 498

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 262

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 254

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 518

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 240

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 230

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 333

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 248

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 222

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 221

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 308

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 258

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 299

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 353

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 293

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 508

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 219

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 290

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 488

原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0

不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。

2026-04-09 18:01:46 275

原创 面向Skills编程:用领域知识工程驱动 Code Agent

团队也使用 SDD 从零AI Coding编写了一个 4000+ 行的业务项目,效果不错——从 0 到 1 的项目,没有存量代码的历史包袱,spec 可以从头写起,不存在与现有代码脱节的问题。过时的知识比没有知识更危险——Code Agent 会带着错误的确定性去执行,并快速复制。当 Code Agent 为了实现需求而读取 Skill 知识文件,随后又查看实际代码时,如果发现知识描述与代码现状不一致,Agent 会在输出实现方案的同时,额外生成一份校验报告,标注不一致的严重程度、具体差异和修正建议。

2026-04-02 18:07:43 561

原创 WSDM’26|阿里妈妈直通车提出搜推广系统通用用户大模型LUM

支持基于 GPU 的 HNSW 等向量检索能力,具备多卡协同存储、检索、D2D 访问和 INT8 量化加速能力,实现向量召回与 LLM 推理的一体化闭环,减少 PCIe 传输和数据拷贝开销,进一步提升搜推广场景下的检索效率与在线推理性能。构建的——召回有召回的模型,预估有预估的模型,各自为战。反观搜推广预估模型,则走在一条不同的发展轨迹上。从FM/FFM的显式特征交叉,到DIN/DIEN的序列注意力建模,再到DeepFM/DCN的高阶交互,每一次突破都依赖针对特定信号设计的功能模块。

2026-03-26 18:00:59 395

原创 AAAI’26 Oral|Agent基于用户长期行为的个性化偏好理解的评估和优化

相比之下,PAL-Set是唯一同时包含行为日志与对话记录的用户-智能体交互数据集,每位用户平均28.9个会话、400.9轮对话,且所有交互均围绕同一用户的一致人设生成,更贴近真实的长期个性化交互场景。在这一蓬勃发展的浪潮中,Mem-PAL作为其中一种的一朵浪花,在基于长期行为的偏好对齐上,抛砖引玉。区别于传统的问答bot,Agent需要基于客户的当前状态、历史行为等记忆深度理解客户的个性化偏好,从而解决客户和投手的个性化营销优化问题,在此背景下,2024年末,AI小万算法同学在此方向展开探索。

2026-03-19 18:05:49 303

原创 WWW‘26 | 克服多重延迟:阿里妈妈展示推广提出级联延迟反馈建模新框架

通过CVR与RFR对用户进行分组,统计转化及退款的延迟反馈时间均值与方差,结果如图所示,(1)左图:高转化用户的支付延迟更短且方差更小,表明高转化用户具有更强的购买意图(2)右图:相较于低退款用户,高退款用户的退款行为平均延迟更短且方差更小。如下图左所示,GMV标签的均值在天内变化显著,分别在午夜、早晨与晚间达到峰值,说明了在线流式训练的必要性;具体来说,模型通过先修正“点击 -> 转化”阶段的偏差,再修正“转化 -> 退款”阶段的延迟,通过两步走的策略确保在流式训练中获得渐进无偏的NetCVR预估。

2026-03-12 18:16:05 318

原创 WWW‘26 | 克服多重延迟:阿里妈妈展示推广提出级联延迟反馈建模新框架

通过CVR与RFR对用户进行分组,统计转化及退款的延迟反馈时间均值与方差,结果如图所示,(1)左图:高转化用户的支付延迟更短且方差更小,表明高转化用户具有更强的购买意图(2)右图:相较于低退款用户,高退款用户的退款行为平均延迟更短且方差更小。如下图左所示,GMV标签的均值在天内变化显著,分别在午夜、早晨与晚间达到峰值,说明了在线流式训练的必要性;具体来说,模型通过先修正“点击 -> 转化”阶段的偏差,再修正“转化 -> 退款”阶段的延迟,通过两步走的策略确保在流式训练中获得渐进无偏的NetCVR预估。

2026-03-12 18:16:05 537

原创 WWW‘26 | 克服多重延迟:阿里妈妈展示推广提出级联延迟反馈建模新框架

通过CVR与RFR对用户进行分组,统计转化及退款的延迟反馈时间均值与方差,结果如图所示,(1)左图:高转化用户的支付延迟更短且方差更小,表明高转化用户具有更强的购买意图(2)右图:相较于低退款用户,高退款用户的退款行为平均延迟更短且方差更小。如下图左所示,GMV标签的均值在天内变化显著,分别在午夜、早晨与晚间达到峰值,说明了在线流式训练的必要性;具体来说,模型通过先修正“点击 -> 转化”阶段的偏差,再修正“转化 -> 退款”阶段的延迟,通过两步走的策略确保在流式训练中获得渐进无偏的NetCVR预估。

2026-03-12 18:16:05 322

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除