Deep Feedback Network for Recommendation

一、论文背景

该论文是腾讯在2020年的IJCAI会议上发表的关于推荐系统的一篇文章。我们先来了解下该论文产生的背景及要解决的问题。
目前许多个性化的推荐系统,都具有用户-项目交互功能。此类信息信号可分为两类,即显性反馈和隐性反馈。
显性反馈:明确的反馈来自用户对商品的直接意见(例如星级或喜欢/不喜欢),它可以精确地指示用户的真实偏好,而收集此类反馈则颇具挑战。
隐式反馈:主要来自暗示间接意见(例如,单击或不单击)的用户行为。在现实世界中的推荐系统中,从大量用户行为中收集这种隐式反馈要容易得多。

二、论文提出的问题

最近,推荐系统通常将个性化推荐视为点击率(CTR)预测任务,因此,大多数推荐算法主要集中在隐式积极反馈(例如点击)上,这些模型直接通过点击行为和以点击率为导向的目标进行了优化,因此不可避免地会导致以下问题:

1、面向点击率的目标通常集中在用户喜欢的内容上,而忽略用户不喜欢的内容。仅仅依靠这些隐式的积极反馈将使模型倾向于提供同质和近视的结果,最终将损害用户体验;

2、除了被动接收模型选择的信息之外,用户还需要有效的反馈机制来主动与推荐系统进行交互

3、用户的隐式反馈和他们的真实偏好之间也存在差距(点击并不总是意味着喜欢

因此,也有研究共同考虑了显式和隐式反馈,但它们将隐性负反馈(不点击)完全看做是反应用户的厌恶。这是不正确的,因为:不点击并不一定表示不喜欢
为此:本文得出结论

  1. 多个显式/隐式和正面/负面反馈可以相互补充,并可以在推荐中更好地反映用户的偏爱偏好

  2. 针对隐性负反馈(不点击),本身存在丰富嘈杂的噪声,要进行更加细致的分析

微信热门故事中的多个反馈示例

在这里插入图片描述
如图所示,形象地描述了各种反馈的具体行为:

(1)隐式正反馈(即,点击)
(2)隐式负反馈(即,向下滑动,不点击)
(3)显式负反馈(即,不喜欢)
这里没有考虑到显示正反馈,是因为,显示正反馈是100%可以标注用户喜欢对于项目的,而且数量较少,无需进行系统预估。

三、论文的方法与思想

方法:旨在共同考虑多个显式/隐式和正面/负面反馈,以了解用户对推荐的偏爱偏好
具体:在真实世界的推荐系统上执行DNF模型,并收集有关用户历史行为的三种类型的反馈:

1.隐式正反馈:点击行为,数量和质量都较好。序列{c1,,cn1}
2.显式负反馈:不喜欢反馈行为,高质量但数量很少。序列:{d1,,dn2}。
3.隐式负反馈:未点击行为,数量极大而存在大量的噪声,质量差。序列{u1,···,un3}

DFN尝试使用高质量的点击(1)和不喜欢的行为(2)作为指导者,以从未单击的行为(3)中提取有用的信息

四、论文DFN总体架构

在这里插入图片描述
如图所示,深度反馈网络主要由两个模块组成,即深度反馈交互模块(Deep feedback interaction)和特征交互模块(Feature interaction module)。注:other features (如:用户个人资料、项目特征和推荐上下文),multiple feedbacks(多个反馈行为序列)

4.1 深度反馈交互模块(Deep feedback interaction)

在这里插入图片描述
其中:

t :行为针对目标项目
序列{c1,,cn1} :隐式正反馈(点击行为)
序列{u1,···,un3}:隐式负反馈(未点击,直接向下划过)
序列:{d1,,dn2}:显式负反馈(直接×掉行为,表示不喜欢)

内部反馈交互组件: 三层transformer

在这里插入图片描述
Google 机器翻译团队提出的一种新的简单网络架构,它完全基于注意力机制,完全消除了重复和卷积。在机器翻译任务上取得了很不错的效果。这里不细讲,详情请见(Attention Is All You Need,NIPS 2017)
这里讲下使用transformer的作用:

捕捉目标项目(t)与特定类型的反馈(三个反馈序列)之间的相互作用(不同语义空间)
通过内部反馈交互组件可得:
1.隐式正反馈(点击序列)特征fc
2.隐式负反馈(未点击序列)特征fu
3.显式负反馈(不喜欢序列)特征fd

总结:内部反馈交互组件很好地捕获了每种反馈序列类型中目标项目与行为之间的行为级交互。它可以为用户提供与目标项目相关的正面和负面偏好

外部反馈交互组件:两个重要注意力

在这里插入图片描述

4.2 特征交互模块(Feature interaction module)

该模块就是点击率预估模型中常见的三个特征阶段:初始一阶线性特征、二阶交互特征和高阶交互特征。
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

五、论文模型的优化

在这里插入图片描述

六、实验部分

数据集来源:从真实的推荐系统微信热门故事构建了一个新的数据集MultiFeed
在这里插入图片描述

6.1 CTR预测

在这里插入图片描述

6.2 Dislike预测

在这里插入图片描述

七、总结

本文的创新点:

1.在以前只关注隐式积极反馈(例如点击)上的基础上,同时考虑了其它的显式/隐式和正/负反馈行为,比如:不喜欢(显示正反馈)和未点击隐式负反馈
2.构造了深度反馈交互模块,更好的学习到了用户的偏好特征。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值