今天分享一篇微信在IJCAI-20发表的推荐论文《Deep Feedback Network for Recommendation》
#摘要
在推荐系统中,用户的显式反馈、隐式反馈、正反馈和负反馈都能够反映用户对于被推荐item的偏好,这类反馈对学习用户表现十分重要。然而,目前的推荐仅仅关注隐式正反馈(例如click),忽略了其他有价值的用户行为。因此本文中,综合考虑了隐式/显式、正/负反馈学习用户在推荐系统的无偏(unbiased)兴趣。具体地,本文提出了新颖的深度反馈网络(DFN)建模click、unclick、dislike等用户行为。DFN有内部反馈交互组件(internal feedback interaction component),能够捕获抓住用户行为序列中的细粒度的行为交互,通过外部反馈交互组件(external feedback interaction component),使用精确但相对稀有的信息,进一步获取丰富但是有噪声的反馈。我们采用真实的推荐系统,在微信Top Stories,证明了DFN的有效性与鲁棒性。
#引言
推荐系统算法往往基于用户与系统的交互,这些交互行为可以大致分为以下两类:显式反馈与隐式反馈。
- 显式反馈源于用于对于item的直接表现,能准确表明用户的偏好。然而, 收集起来有一定的难度。
- 隐式反馈从用户的行为中间接获得。这些信息在推荐系统中往往是海量的,但是这些信息有着较多噪声(用户点击的并不一定是他真正喜欢的)。
例如
反馈 | 显式 | 隐式 |
---|---|---|
正反馈 | 购买/五星好评/收藏 | 点击 |
负反馈 | 差评 | 曝光未点击 |
在近期的深度推荐系统中,CTR导向的目标受到极大关注。因此,模型不可避免地只关注和目标紧密相关的用户点击行为。仅考虑CTR导向目标的推荐模型往往会导致如下问题:
- CTR导向目标只关注用户喜欢什么,不关注用户不喜欢什么。这样,模型的推荐结果容易同质化(homogeneous)和趋热化(myopic),损害用户体验。因此,推荐系统中应考虑负反馈信息。
- 除了被动地接受系统推荐的item外,用户也需要能主动和即时的反馈机制,可以高效和准确地告知系统自己喜欢或者不喜欢什么。
- 另外,用户的显式和隐式反馈之间也会存在gap(用户点击的并不一定是他真正喜欢的)。因此,显式反馈也是必要的。
Specifically, we first conduct trans- former over the target item and behaviors separately in each feedback sequence to capture internal behavior-level interactions.
(internal)在目标item 和 行为上分别 构建 transformer,去捕获行为层级交互。?????
(external) 使用高质量但相对稀疏的click 去降噪丰富但是没有点击的行为。
代码复现:
https://github.com/qqxiaochongqq/DFN
参考链接: