WWW21:Disentangling User Interest and Conformity for Recommendation with Causal Embedding

Disentangling User Interest and Conformity for Recommendation with Causal Embedding

概述

DICE 模型利用因果推断技术,将混杂了兴趣与从众性的传统 embedding 解耦。解耦后的 embedding 各自使用特定样本训练,实现了用户兴趣与从众性的巧妙剥离,达到同时利用流行度偏差与用户兴趣以提升推荐指标的目的。

Embedding 解耦

用户对物料的消费行为可同时来源于用户兴趣和用户从众性,因此用户u和物料i的总匹配分Sui计算如下,为兴趣匹配分Sinterestui与从众匹配分Sconformityui两部分之和。

在这里插入图片描述

DICE 使用了两套 embedding 来分别计算兴趣匹配分Sinterestui 与从众性匹配分Sconformity​~ui ​~

在这里插入图片描述

从如下因果图中可知,用户的点击行为同时取决于用户兴趣与用户从众性,兴趣与从众性是因,用户点击行为是果,箭头朝向由因至果。直观来看,兴趣 embedding 与从众 embedding 需要各自特定的样本来训练,但实际中无法准确判定用户行为背后的起因,由此无法精确的对样本做切分。幸运的是,在因果图中用户兴趣、从众性与用户点击行为三个节点形成对撞结构,利用对撞结构中条件相关理论,可大致推测用户行为背后的起因。‍

在这里插入图片描述

即当“用户行为”被确定时,其背后原因“用户兴趣”与“从众性”呈相关关系。比如当用户发生点击行为,且物料流行度很低时,可推测该点击行为由用户兴趣触发。设MI为用户与物料的兴趣分匹配矩阵,MH为从众性匹配矩阵,两者大小关系讨论如下。

据此,文章根据正负样本的流行度拆分数据集O1 、O2

1)O1:正样本a比负样本b流行

在这里插入图片描述

2)O2:正样本c没负样本d流行,在O2数据集,有理由相信用户出于兴趣,选择消费不流行的c而不是d

在这里插入图片描述

embedding 差异化任务

DICE 模型利用上述不等式,使用特定样本对不同的 embedding 训练,实现了用户兴趣 embedding 与从众性 embedding 的解耦。但该不等式是粗糙的,为进一步剥离用户兴趣与从众性,论文分别尝试了一阶范数、二阶范数和协方差强行增加两类 embedding 的差异性。实验结果表明,协方差效果最好但耗时高,因此不适用于大规模数据。DICE 模型的四个任务如公式所示,分别为点击任务、兴趣任务、从众性任务、embedding 差异化任务。
在这里插入图片描述

在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值