Disentangling User Interest and Conformity for Recommendation with Causal Embedding
概述
DICE 模型利用因果推断技术,将混杂了兴趣与从众性的传统 embedding 解耦。解耦后的 embedding 各自使用特定样本训练,实现了用户兴趣与从众性的巧妙剥离,达到同时利用流行度偏差与用户兴趣以提升推荐指标的目的。
Embedding 解耦
用户对物料的消费行为可同时来源于用户兴趣和用户从众性,因此用户u和物料i的总匹配分Sui计算如下,为兴趣匹配分Sinterestui与从众匹配分Sconformityui两部分之和。
DICE 使用了两套 embedding 来分别计算兴趣匹配分Sinterestui 与从众性匹配分Sconformity~ui ~
从如下因果图中可知,用户的点击行为同时取决于用户兴趣与用户从众性,兴趣与从众性是因,用户点击行为是果,箭头朝向由因至果。直观来看,兴趣 embedding 与从众 embedding 需要各自特定的样本来训练,但实际中无法准确判定用户行为背后的起因,由此无法精确的对样本做切分。幸运的是,在因果图中用户兴趣、从众性与用户点击行为三个节点形成对撞结构,利用对撞结构中条件相关理论,可大致推测用户行为背后的起因。
即当“用户行为”被确定时,其背后原因“用户兴趣”与“从众性”呈相关关系。比如当用户发生点击行为,且物料流行度很低时,可推测该点击行为由用户兴趣触发。设MI为用户与物料的兴趣分匹配矩阵,MH为从众性匹配矩阵,两者大小关系讨论如下。
据此,文章根据正负样本的流行度拆分数据集O1 、O2
1)O1:正样本a比负样本b流行
2)O2:正样本c没负样本d流行,在O2数据集,有理由相信用户出于兴趣,选择消费不流行的c而不是d
embedding 差异化任务
DICE 模型利用上述不等式,使用特定样本对不同的 embedding 训练,实现了用户兴趣 embedding 与从众性 embedding 的解耦。但该不等式是粗糙的,为进一步剥离用户兴趣与从众性,论文分别尝试了一阶范数、二阶范数和协方差强行增加两类 embedding 的差异性。实验结果表明,协方差效果最好但耗时高,因此不适用于大规模数据。DICE 模型的四个任务如公式所示,分别为点击任务、兴趣任务、从众性任务、embedding 差异化任务。