©PaperWeekly 原创 · 作者 | 夏良昊
单位 | 香港大学
研究方向 | 推荐系统
论文题目:
Hypergraph Contrastive Collaborative Filtering
收录会议:
SIGIR 2022
论文链接:
https://arxiv.org/pdf/2204.12200.pdf
代码链接:
https://github.com/akaxlh/HCCF
港大数据智能实验室(指导老师:黄超)
https://sites.google.com/view/chaoh
研究背景
近年来,个性化推荐系统(Recommender Systems)被广泛应用于各类线上服务,例如淘宝、亚马逊等线上购物平台,微信、Facebook 等社交网络,Youtube、抖音等线上视频网站。推荐系统根据用户、商品的特征,帮助用户寻找符合个人偏好的商品,以缓解信息过载问题。在各类推荐系统框架中,基于矩阵分解、深度神经网络等方法的协同过滤(Collaborative Filtering)技术已经成为大多数推荐系统的基础架构。协同过滤框架背后的基本思路是,根据用户、商品的历史交互信息,将用户和商品映射到低维空间进行表征。
随着图神经网络方法(Graph Neural Networks)在各类图表征任务上取得了巨大的成功,利用图神经网络对用户、商品的图结构交互数据进行挖掘,成为了协同过滤领域备受关注的研究方向。近年来,一些工作对这一方向进行了深入挖掘,探索了如何沿用户、商品交互边进行信息传播,以使用用户、商品表征更好地反映交互图的邻域子图结构。
尽管基于图神经网络的协同过滤在各个指标上都展现出了优越的性能,但现有工作仍然存在一些关键问题亟待解决,具体来说,本文试图解决以下两个问题:
1)图表征过平滑问题。当协同过滤方法叠加更多图神经网络层时,用户、商品的节点信息会被传播到大量距离较远的节点,导致节点表征过度相似、无法区分,且这一过程中难以避免地在节点表征中引入了不相关的远距离节点信息,这些问题严重影响了对交互图中的高阶协同关系进行有效学习。
下图展示了一些基于图神经网络的协同过滤方法存在的过平滑问题。本文测试了 LightGCN、GCCF、PinSAGE、ST-GCN 四种图神经网络方法,在不同图神经网络层迭代次数下的 MAD 指标和 NDCG 指标。其中,MAD 指标衡量节点表征之间的平均距离,而 NDCG 指标衡量模型给出推荐列表的准确程度。
从结果可以看出,当图神经网络迭代次数增多后,节点表征变得越来越相似,同时模型效果也出现下降。这一结果验证了现有图神经网络架构在迭代次数增多时由于过平滑问题出现的效果退化。因此,缓解过平滑问题,对用户、商品交互图进行更好的建模,以得到可区分、高质量的节点表征,是这一方向亟待解决的问题之一。
2)监督信号的稀疏问题和噪声问题。大多数基于图网络的协同过滤方法属于监督学习模式,用户、商品交互记录作为监督信号指引节点表征学习过程。在这样的范式下,协同过滤方法的效果极大程度上依赖充足、准确的用户交互记录作为监督信号,在监督信号稀缺的情况下,很难学得准确、高质量的用户、商品表征。
然而