Q&R: A Two-Stage Approach toward Interactive Recommendation 翻译

Q&R: A Two-Stage Approach toward Interactive Recommendation

ABSTRACT

Recommendation systems, prevalent in many applications, aim to surface to users the right content at the right time. Recently, researchers have aspired to develop conversational systems that offer seamless interactions with users, more effectively eliciting user preferences and offering better recommendations.
  在许多应用程序中流行的推荐系统,旨在在正确的时间向用户显示正确的内容。最近,研究人员渴望开发与用户无缝交互的对话系统,更有效地激发用户偏好并提供更好的推荐。
Taking a step towards this goal, this paper explores the two stages of a single round of conversation with a user: which question to ask the user, and how to use their feedback to respond with a more accurate recommendation. Following these two stages, first, we detail an RNN-based model for generating topics a user might be interested in, and then extend a state-of-the-art RNN-based video recommender to incorporate the user’s selected topic. We describe our proposed system Q&R, i.e., Question & Recommendation, and the surrogate tasks we utilize to bootstrap data for training our models. We evaluate different components of Q&R on live traffic in various applications within YouTube: User Onboarding, Homepage Recommendation, and Notifications. Our results demonstrate
that our approach improves upon state-of-the-art recommendation models, including RNNs, and makes these applications more useful, such as a > 1% increase in video notifications opened. Further, our design choices can be useful to practitioners wanting to transition to more conversational recommendation systems.
  为了实现这一目标,本文探索了与用户进行单轮对话的两个阶段:向用户询问哪些问题,以及如何利用用户的反馈做出更准确的推荐。在这两个阶段之后,首先,我们详细介绍了一个基于RNN的模型,用于生成用户可能感兴趣的主题,然后扩展了一个先进的基于rnn的视频推荐,以纳入用户选择的主题。我们描述我们提出的系统Q&R,即,Question & Recommendation的问题,以及我们用来引导数据以训练模型的代理任务。我们评估YouTube内部不同应用程序中实时流量的Q&R的不同组成部分:用户登录、主页推荐和通知。我们的结果表明,我们的方法改进了最先进的推荐模型,包括RNNs,并使这些应用程序更有用,如打开的视频通知增加>1%。此外,我们的设计选择对于想要转换到更具对话性的推荐系统的从业者是有用的。

1 INTRODUCTION

  推荐系统在帮助用户在大量可用信息中进行导航时发挥着关键作用,通过为他们选择正确的项目,即。产品购买,内容阅读,视频观看,在正确的时间[3]。
  最近,推荐研究者和实践者都渴望通过构建会话式推荐器来推进推荐的前沿,以创造与用户的无缝交互。这样的系统可以更好地模拟真实人们给的建议—他们试图通过在特定上下文中询问几个问题来快速理解用户偏好,然后根据响应[12]给出建议。它们应该预测用户潜在的发展中、未明确表达的兴趣,同时考虑到用户可能对世界[42]有偏见这一事实。他们的目标是通过展示有趣的内容来帮助获得新用户,并保留现有的用户基础; 任何推荐系统的双重目标都是可持续的。
  最近,这个看似遥不可及的目标开始变得更加切实可行。为了实现这一目标,主要有两项工作。一方面,大量的个人助理已经开始出现在跨域的各种各样的产品,从健康娱乐或零售机器人虚拟助手[38,4,22],这样的系统是由最近的进步自然语言理解[44],专注于谈话,而不是推荐。另一方面,会话式推荐器在实现推荐的同时,关注的是如何平衡推荐系统中存在的探索和开发的权衡[12,47]。
   我们的工作为工业会话推荐者提供了一种新的观点。我们认为,要想过渡到真正的交互式推荐系统,我们需要从这两个角度出发的组件。我们的系统由两个部分组成:一个问题询问组件和一个项目推荐组件,它遵循了一轮用户系统对话的两个主要阶段。此外,我们需要解决如何引导这样的系统,当用户和系统对话之间缺乏数据时。
为此,我们利用从传统推荐器中选择的代理任务中获得的数据,并基于这些数据引导系统的组件。其结果是一种新型的大规模学习交互式推荐器Q&R。 Question & Recommendation.。这是迄今为止我们所知道的第一个对这种系统的详细公开描述。
   从建模的角度来看,我们将会话推荐定义为分解出用户决策的组件。这种方法允许用户在中间状态给出反馈,并通常改进建议。此外,我们使用顺序RNN模型来捕捉对话中出现的“下一步”设置,并通过询问用户话题问题进行干预,让他们更好地表达自己的偏好并控制个性化体验。我们展示了我们在全球最大视频平台YouTube上的发展[13,15];然而,我们的方法本身并不是针对视频推荐的。特别是有四大贡献:

  1. 我们对大规模学习型交互式推荐系统Q&R进行了详细的描述,该系统向用户询问有关主题的问题并给出项目推荐(第3节)。
  2. 为了克服缺少会话数据的挑战,我们讨论了如何利用代理任务从非会话推荐器使用大规模数据引导会话(第4节)。
  3. 基于RNN的双因素推荐:我们在两阶段(“问什么?”“如何回应?”)的背景下为交互推荐建模,并提出了新的基于神经网络的RNN模型用于双因素推荐(第5节)。
  4. YouTube上的实时流量结果:我们发现Q&R可以在YouTube的多个应用中提升用户体验,凸显出我们方法的广泛影响(第6节)。特别是,普通用户完成用户体验的可能性增加了18%,当他们完成用户体验时,他们选择的主题增加了77.7%。此外,我们的双因素视频推荐方法可以让用户看到更有趣的视频,即使是在YouTube主页和YouTube通知中复杂的、最先进的RNN推荐器之上(表1)。
    Q&R有助于更好地理解用户偏好,从而在多个YouTube应用程序中获得更好的用户体验。

2 RELATED WORK

   由于我们研究的是用户和系统之间的单轮对话,我们的工作可以在会话推荐系统的大背景下进行。
   以对话方式提出建议的必要性[14,28]已经从多个角度进行了研究,包括基于访谈的[41]、主动学习的[39]、基于熵的[47]、基于图

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值