- 博客(1290)
- 收藏
- 关注
原创 SIGIR‘26 | 多时间尺度轨迹自回归模型TAR,破解推广投放中的“粒度不匹配“难题
值得深入分析的是提升幅度的分布模式:在低预算(50%、75%)时提升最为显著(8.4%、13.5%),这是因为低预算下可赢得的曝光更少、转化更稀疏,粒度不匹配问题最严重,TAR 的多尺度机制优势最为突出;这一设计的精巧之处在于:动作序列作为状态轨迹的"一阶差分信息"被嵌入生成目标本身,使得从粗到细的轨迹生成天然包含了从粗到细的动作规划。这验证了论文的核心论点:多尺度生成在"反馈时间错位"场景中的价值更大——因为延迟反馈的本质就是信息在时间轴上的弥散,粗尺度观测天然"收纳"了这种弥散。
2026-05-28 18:01:00
370
原创 ACL’26 Oral|补齐LLM的“社交短板”!新框架首次将图数据作为监督信号,宏观微观全面对齐
值得注意的是,尽管基于 8B 参数 backbone,Graphia 在多个数据集上超越或媲美更大规模 LLM(如 Qwen3-32B、Llama3.1-70B)。它利用图数据作为LLM 后训练阶段的监督信息,并引入强化学习机制:基于图神经网络 (GNN) 的结构奖励来训练专门的智能体,使其能够预测与谁交互(目标选择)以及如何交互(边生成),然后通过预先设计的图生成流程进行操作。(2)结构奖励设计:引入更高阶拓扑属性(如社区凝聚、三元闭包)到奖励函数中,提升模型在不同图结构下的泛化能力。
2026-05-21 18:00:00
365
原创 让大模型自己学会拍卖!LLM-Auction将营销内容分配与自然回答生成合二为一
同时,定性的案例展示出:①相比预训练 LLM,LLM-Auction 对营销内容的分配有更好的语义匹配性,并会将营销内容自然融入回答叙事;Oracle版本的LLM-Auction的性能进一步预示了,随着效果预估模型精度的提升,LLM-Auction仍有可观的提升空间。LLM-Auction 将拍卖机制设计与 LLM 对齐技术结合,提出了首个统一分配与生成的基于学习的机制框架:通过偏好对齐让 LLM 自身成为分配规则,天然建模上下文外部性,并在不增加额外推理开销的情况下获得更高分配效率。
2026-05-14 18:01:13
571
原创 WWW’26 Oral | DARA:面向在线推广的小样本预算分配双阶段RL‑LLM框架
DARA 框架通过将预算分配任务拆分为小样本推理和精细化优化两个阶段,结合 RL 微调提升了 LLM 的数值推理能力,在在线推广预算规划中取得了显著效果。这是因为随着策略持续优化,当前策略与固定参考策略之间的分布差距越来越大,KL 正则化项会产生越来越强的"拉回力",将模型束缚在一个已经过时的基线附近,最终导致推理能力退化——这在预算分配这类需要多步精确数值计算的任务中尤为致命。算法 1 总结了双阶段协同的流程:首先通过小样本推理器生成初始预算,随后在每个周期内根据反馈调整预算,直到满足终止条件。
2026-05-07 18:13:57
363
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
546
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
322
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
590
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
649
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
601
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
542
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
648
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
339
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
410
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
269
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
396
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
521
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
304
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
在电商搜索场景中,用户的一次搜索往往同时触及商品的多个模态维度。以搜索"小香风外套"为例,系统不仅需要从商品主图中识别 "编织纹理" 与 "版型设计" 等关键元素,还需从商品文本中解析"羊毛"、"短款"、"春季新款"等关键属性,更需要综合判断图像与文本所描述的是否为同一件商品。这一过程的背后,折射出不同模态在信息表达上的天然互补性:图像直观呈现形态、颜色与设计元素,文本则更擅长承载品牌、材质、功能及适用场景等结构化语义,任何单一模态都仅能覆盖商品信息的部分维度,难以独立支撑精准的商品理解与匹配。然而真正加剧
2026-04-09 18:01:46
518
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
298
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
283
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
543
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
260
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
259
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
350
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
266
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
238
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
236
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
320
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
274
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
313
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
367
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
309
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
538
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
241
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
309
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
562
原创 CVPR‘26 | 从任务统一到模态协同:电商通用多模态表征MOON 2.0
不同任务的数据配比会隐式改变各模态在训练过程中的主导地位,当某一模态占据主导时,模型表征将逐渐偏向该模态的语义分布,换言之,图搜与文搜并未形成真正的协同优化,而是在共享参数空间中竞争有限的表示容量。具体而言,MOON 2.0 通过模态自适应的专家混合建模机制、双重语义对齐机制与图文协同增强三项关键技术设计,首次在电商场景下实现了面向动态模态平衡的多模态表征学习,有效缓解了模态主导偏移与跷跷板效应,为通用电商多模态表征基座的构建提供了新的技术范式。经过多轮迭代,我们对多模态表征的定位有了更深刻的认识。
2026-04-09 18:01:46
307
原创 面向Skills编程:用领域知识工程驱动 Code Agent
团队也使用 SDD 从零AI Coding编写了一个 4000+ 行的业务项目,效果不错——从 0 到 1 的项目,没有存量代码的历史包袱,spec 可以从头写起,不存在与现有代码脱节的问题。过时的知识比没有知识更危险——Code Agent 会带着错误的确定性去执行,并快速复制。当 Code Agent 为了实现需求而读取 Skill 知识文件,随后又查看实际代码时,如果发现知识描述与代码现状不一致,Agent 会在输出实现方案的同时,额外生成一份校验报告,标注不一致的严重程度、具体差异和修正建议。
2026-04-02 18:07:43
590
原创 WSDM’26|阿里妈妈直通车提出搜推广系统通用用户大模型LUM
支持基于 GPU 的 HNSW 等向量检索能力,具备多卡协同存储、检索、D2D 访问和 INT8 量化加速能力,实现向量召回与 LLM 推理的一体化闭环,减少 PCIe 传输和数据拷贝开销,进一步提升搜推广场景下的检索效率与在线推理性能。构建的——召回有召回的模型,预估有预估的模型,各自为战。反观搜推广预估模型,则走在一条不同的发展轨迹上。从FM/FFM的显式特征交叉,到DIN/DIEN的序列注意力建模,再到DeepFM/DCN的高阶交互,每一次突破都依赖针对特定信号设计的功能模块。
2026-03-26 18:00:59
421
原创 AAAI’26 Oral|Agent基于用户长期行为的个性化偏好理解的评估和优化
相比之下,PAL-Set是唯一同时包含行为日志与对话记录的用户-智能体交互数据集,每位用户平均28.9个会话、400.9轮对话,且所有交互均围绕同一用户的一致人设生成,更贴近真实的长期个性化交互场景。在这一蓬勃发展的浪潮中,Mem-PAL作为其中一种的一朵浪花,在基于长期行为的偏好对齐上,抛砖引玉。区别于传统的问答bot,Agent需要基于客户的当前状态、历史行为等记忆深度理解客户的个性化偏好,从而解决客户和投手的个性化营销优化问题,在此背景下,2024年末,AI小万算法同学在此方向展开探索。
2026-03-19 18:05:49
358
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅