前言
原文链接:Link prediction
主要解决的问题:捆版推荐,以往多是单个物品推荐,或者将bundle的商品视作一个物品进行推荐,没有积累bundle的描述或者分类信息(单个商品有),如何衡量不同包之间的相关性。
方法使用
节点种类不同的问题,本质上是一个link prediction的问题。再次使用GCN,GCN可以同时学习拓扑结构和节点属性。R-GCN对GCN进行改进,节点可以是不同type的。
解决冷启动问题,首先Embedding,然后将每个隐藏层的layer表示抽出然后concat(我们认为不同隐藏层的表示含义不同),然后将hu和hi的最终表示concat以预测u->i的偏好,同理预测u->b的偏好。在没有bundle以往数据的情况下同样可以进行推荐。
新Loss指标的选取,使用BPR作为loss,用户以前有交互的是positive,用户以前没有交互的是neg(交叉训练)
解决标签偏斜问题,我们更新u的时候会影响b的表示,反之同理。我们使用min-batch解决这个问题,随机删掉一些边(类似于bert中的random mask),然后预测这些边的weights,
其他:也有工程的实现。