IntentGC: a Scalable Graph Convolution Framework Fusing Heterogeneous Information for Recommendation
背景介绍
文章核心思想?
文章收集大量user-item信息,比如说用户购买品牌、用户偏好的类别、用户浏览的商店、用户搜索的记录;item的品牌、item类别、item店铺、item性质等,利用这些信息构造异构图,提出了IntentGC模型,可以结合不同类型关系学习。在IntentGC中,还设计了快速GCN模型:IntentNet,避免不必要的特征交互,减少模型复杂度。本文提出的模型在大规模真实数据中表现良好。
本文工作:
1. 充分利用辅助信息。文中把一阶关系转化为二阶关系构图。一阶相似性:如果用户1搜索了Spiderman,那么可以认为用户1和Spiderman直接相连,认为他们有一阶相似性。二阶相似性:如果用户1和用户2都搜索了Spiderman, ironman, thor,我们认为这两个用户的关系更强,有二阶相似性。文章根据不同节点类型,产生二阶相似性的异构关系,并对二阶关系赋予权重,实验表示学习这种二阶相似度可以改善模型的表现。
2. 快速图卷积。为了减少模型复杂度,我们提出了IntentNet快速图卷积方法,此方法将图卷积划分为两个部分:1)vector-wise邻居卷积部分;2)节点特征交互的全连接部分。通过此种方法避免了无意义的特征交互,此种方法比GraphSAGE更高效。
3. 异构网络中二部图卷积:分别利用两个IntentNet来学习用户和item的向量表示,将二者全连接映射到同一个向量空间后,显式学习用户和item的相关性
user-item 推荐问题定义
用户节点 , item节点 ,其他类型节点 (品牌、搜索、店铺等),边 ,其中 是用户和item节点之间的边, 表示其他类型的边。推荐问题是要根据用户的历史行为来预测用户可能偏好的item,可以 把user-item推荐问题看作是链路预测问题,即预测用户和item之间是否有边相连。
算法原理
模型分为三个部分:
Network Translation 把原始图转化为user-user, item-item, user-item图
Faster Convolution Network: IntentNet 快速卷积算法学习用户和item的向量表示
Dual Graph Conbolution in HIN: 学习用户和向量的链接关系
Network Translation
网络中有多种信息,下图为电子商务网络中有多种信息的异构图。左边为用户,右边为item,节点有多种类型:品牌、商店、类别、搜索、性质等;边也有多种类型:购买、浏览、搜索、偏好、属于、共现等,利用如此多的信息进行建模时,复杂度很高,然而在推荐系统中,我们只需要考虑user和item的关系,因此我们希望把原始复杂的图转化为user-user, item-item,user-item关系图。