【GCN-CTR】DC-GNN: Decoupled GNN for Improving and Accelerating Large-Scale E-commerce Retrieval WWW22

最新推荐文章于 2024-05-09 10:41:25 发布

chad_lee

最新推荐文章于 2024-05-09 10:41:25 发布

阅读量505

点赞数

分类专栏：论文解读推荐系统图神经网络文章标签：机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yanguang1470/article/details/125883323

版权

本文提出DC-GNN模型，通过预训练、深聚合和CTR预测三阶段，解决工业场景中大规模GNN计算开销问题。在预训练阶段，采用链接预测和多视图图对比学习。实验表明，DC-GNN在提高效率的同时，提升了电商检索的性能。

摘要由CSDN通过智能技术生成

《DC-GNN: Decoupled Graph Neural Networks for Improving and Accelerating Large-Scale E-commerce Retrieval》(WWW’22)

在工业场景中，数百亿节点和数千亿的边直接端到端的GNN-based CTR模型开销太大，文章把整个GNN框架解耦成三阶段：预训练、聚合、CTR。

但实际上文章是把计算开销前移，将图卷积的计算开销转换成了采样子图的计算开销。

图与数据集

在这里插入图片描述

用Taobao近7天的记录作为数据集，有三类节点：user、query和item，每个节点都有丰富的节点属性：设备、年龄等。

有三类边：query搜索item、用户浏览item、用户搜索query。

一共9亿节点、100亿条边。

方法

在这里插入图片描述

预训练

每个节点先用RW生成三个该节点的子图，然后在子图上用GNN encoder对节点进行卷积编码，得到节点的embedding，然后两个预训练任务：

Link Prediction

$\mathcal{L}_{l i n k}=\sum_{\left(q, i_{p}\right) \in \mathcal{E}}\left(-\log \sigma\left(f_{s}\left(q, i_{p}\right)\right)-\sum_{k} \log \left(1-\sigma\left(f_{s}\left(q, i_{n}^{k}\right)\right)\right)\right)$

有边连接的是正例，然后采集k个负例，负例用到了难负样本挖掘：

在这里插入图片描述

一种是选择K-hop的节点作为负样本，K可以控制难易程度；一种是在维持图结构不变的情况下，将一个正样本替换成全局采得负样本。

文章认为这两种做法都可以强化GNN更加注意节点的属性学习上，避免GNN过分依赖图结构特征，从而缓解over-smoothing。

Multi-view graph contrastive learning

第二个子图和第三个子图得到的embedding，进行对比学习，同一个节点在两个视图的embedding是正例，不同节点是负例。这里只考虑同一类节点之间计算InfoNCE loss，因此会有三个对比学习loss。

所有的loss加起来是total loss：

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【GCN-CTR】DC-GNN: Decoupled GNN for Improving and Accelerating Large-Scale E-commerce Retrieval WWW22

第二个子图和第三个子图得到的embedding，进行对比学习，同一个节点在两个视图的embedding是正例，不同节点是负例。，比如targetnode是user，给这个节点采样三个子图出来，每个子图出了targetnode之外，分别只包含user、query、item节点。用Taobao近7天的记录作为数据集，有三类节点user、query和item，每个节点都有丰富的节点属性设备、年龄等。然后在已有子图的基础上，和SIGN那篇一样，直接将不同阶卷积的向量拼接起来。有边连接的是正例，然后采集。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。