Motivation:
传统推荐模型仅利用一种类型的行为(购买)存在严重的数据稀疏和冷启动问题,利用多种行为的交互数据可以缓解这一问题。
现存的多行为推荐模型中存在两点不足:
- 没有捕获不同行为对目标行为的不同影响。
- 忽视了在多行为数据中行为语义的建模。
本文构造了一个统一图来表示多行为数据并提出了MBGCN。
处理上述两点局限性:通过用户-物品的传播来学习行为强度并且通过物品-物品的传播来捕获行为语义。
Contribute:
1.构建了一个异构图去表示多种反馈数据,它没有任何限制每种行为类型的偏好强度。
2.对于构建的图,提出一种基于图卷积网络的推荐模型。一方面,设计了一种行为感知的用户到物品的嵌入传播层去捕获不同行为的多样化影响;另一方面,设计了一种物品到物品的嵌入传播层去建模物品到物品的相似度,它可以反应不同行为的不同语义。
3.在两个真实世界数据集上做实验,显示出提出模型的有效性。进一步研究提出的模型对于冷启动用户有更高的应用价值。
Problem formulation
构建图:
T种行为,交互矩阵表示成{Y1,Y2,…,YT},1~T-1位置表示成辅助行为矩阵,T位置表示成目标行为矩阵。所有行为矩阵都是01矩阵。
注意:在这里没有做任何限制去指定行为顺序和行为强度顺序。
Method:
MBGCN包括4个重要组件:
(1)Embedding Layer
(2)用户-物品传播层去学习每种行为的强度,同时基于多行为用户物品交互数据提取协同过滤信号。
(3)物品-物品传播层去改善物品的特殊关系(基于行为类型的行为语义)。
(4)联合预测模块
(一):Embedding Layer
P和Q分别表示用户和物品的嵌入矩阵。
对于具体用户和物品,常规操作,One-Hot编码提取嵌入表示。
(二):用户-物品传播层
(1)物品到用户嵌入传播模块(更新用户嵌入表征)
User Behavior Propagation Weight Calculation.
计算用户第t种行为的强度,Wt是行为t的行为重要性权重(所有用户都相同),Nut是用户u在t行为下交互数量。
Neighbour Item Aggregation Based on behavior.
图卷积操作,用户在行为t下聚合邻居节点,aggregate本文为了简单做mean function。
Behavior-level Item Propagation for User.
更新用户表征,加权和。
(2)用户到物品嵌入传播模块(更新物品嵌入表征)
注意,这里只在更新用户表征时区分行为的强度。更新物品表征时,区分每种行为的重要程度没被考虑,不合适。对于物品表征的改善作者又设计了物品到物品的相关性模块。
(三):物品-物品传播层
对于物品到物品的模块。在行为t下,目标用户i聚合共同被用户交互过的物品j。
每个物品都会得到T个不同行为嵌入表征。
(四)联合预测模块
用户最终表示、物品最终表示、物品相关性最终表示。
User-based CF Scoring. (U-I)
Item-based CF Scoring. (I-I)
分母是用户u在行为t下交互物品数量。
Combined Scoring.
Model Training
Dataset:
Experiments:
本文围绕以上四个问题展开实验讨论。
Baseline:
Overall Performance (RQ1)
总结:多行为比单行为性能好。关注不同行为强度以及每种行为语义信息,所以MBGCN在所有sota模型中最好。
Ablation Study (RQ2)
Table4,研究自动学习每种行为的权重效果是最好的。
Table5,研究计算所有行为的相关性效果是最好的。
Cold-start Problem (RQ3)
文中选取了1000个用户,在训练时把1000个用户的数据都删除,但是保留用户,在测试阶段,利用训练的数据(不包括1000个用户)去打分。因为MBGCN有计算物品-物品相似度模块,所以利用冷启动用户在测试阶段的辅助行为交互物品去计算所有物品的得分。(我的理解,不对可以交流)
Hyper-parameter Study (RQ4)