BOMGraph：基于统一图神经网络的电商多场景召回方法

阿里妈妈技术

于 2023-11-01 19:02:39 发布

阅读量285

点赞数

文章标签：神经网络人工智能深度学习机器学习

本文链接：https://blog.csdn.net/alimama_Tech/article/details/134279837

版权

1. 摘要

手机淘宝支持用户以多种形式来进行搜索，除了常用的文本搜索，还支持拍照搜索、相似商品搜索。不同场景之间在数据分布上存在许多共性和差异性。能否利用场景之间的共性来缓解单场景样本稀疏性问题，提升召回效果，同时避免统一建模对于各场景差异化建模的影响。因此，本文提出了一种统一的基于图神经网络的召回方法（BOosting Multiscenario E-commerce Search with a unified Graph neural network，BOMGraph），BOMGraph包含几个组件来解决上述多场景建模存在的挑战。首先是在节点图卷积的时候通过场景内和场景间的metapath来传播跨场景之间的异构信息。其次，我们提出了一个解耦网络来为商品提取场景公共和独有的表示，显式的建模不同场景之间的共性和差异性。最后，通过基于跨场景的样本增强和对比学习，来解决商品在单个场景由于长尾和样本稀疏导致学习不充分的问题。离线评估和在线A/B测试均证明了BOMGraph的有效性，目前该方案已在搜索广告在线业务中投入使用。

论文：【CIKM 2023】BOMGraph: Boosting Multi-scenario E-commerce Search with a Unified Graph Neural Network

作者：Shuai Fan, Jinping Gou, Yang Li, Jiaxing Bai, Chen Lin, Wanxian Guan, Xubin Li, Hongbo Deng, Jian Xu, Bo Zheng

下载（点击↓阅读原文）：https://dl.acm.org/doi/10.1145/3583780.3614794

2. 背景

图1：多模态多场景联合搜索示例

如图1所示，用户可以在首页进行文本搜索和拍照搜索，也可以在搜索结果页长按商品触发相似商品搜索。不同搜索方式从不同的入口发起，并且接受不同模态的查询输入，包括文本、图片和商品。

此外，用户还会交替使用不同的搜索方式。例如图1(b)中，用户想要购买一件连衣裙，从拍照搜索切换到文本搜索和相似商品搜索。由于每个搜索场景会侧重不同的模态信息，因此在交替搜索的过程中，能够更全面的表达用户的偏好（即“粉色、法式碎花、吊带裙、奢华面料”）。

这种多个搜索场景之间的关联性为多场景建模提供了机会。最新研究也表明，利用多场景数据联合建模可以提高单个场景的性能，缓解单场景的样本稀疏问题。本文核心目标是为手淘搜索的多个场景设计一套统一的图神经网络召回方法，其中主要面临以下3个挑战：1）如何捕捉不同场景的异构信息传递；2）如何学习场景鲁棒的商品表示；3）如何缓解单场景长尾商品样本稀疏问题。

3. 方法

BOMGraph使用多个场景数据来构建查询、触发商品和商品的大规模异构图，并定义元路径来更新图中节点的信息，异构图通过多场景图编码器进行编码，该编码器通过元路径引导的信息传播来获得节点嵌入，捕捉不同场景之间的异构信息传递。然后将经过图编码的商品节点嵌入通过解耦表示模块进行解耦，学习场景鲁棒的商品表示。最后，通过在训练过程中加入跨场景数据扩充和对比学习损失缓解单场景长尾商品点击不足学习不充分的问题。接下来介绍统一图神经网络召回框架的细节。