Modeling Personalized Item Frequency Information for Next-basket Recommendation SIGIR2020

验证了RNN没有办法学习矢量和,且最终结果p直接就是进行结果的排序

ABSTRACT

下一篮子推荐(NBR)在电子商务和零售业中非常普遍。在此场景中,用户一次购买一组商品(一个篮子)。NBR基于一系列篮子执行顺序建模和推荐。NBR通常比被广泛研究的顺序(基于会话)推荐要复杂得多,后者根据一系列项目推荐下一项。递归神经网络(RNN)已被证明是一种非常有效的序贯建模方法,因此适用于NBR。然而,我们认为现有的RNN不能直接捕获推荐场景中的项目频率信息
通过对真实数据集的仔细分析,我们发现个性化商品频率(PIF)信息(记录用户购买每件商品的次数)为NBR提供了两个关键信号。但是,现有的方法在很大程度上忽略了这一点。尽管现有的基于RNN的方法具有很强的表示能力,但我们的实验结果表明,它们不能学习和捕获PIF。因此,现有的方法不能充分利用PIF中包含的关键信号。鉴于RNN的这一固有局限性,我们提出了一种简单的基于项频的k近邻(KNN)方法来直接利用这些关键信号。我们在四个公开的真实数据集上对我们的方法进行了评估。尽管我们的方法相对简单,但当与PIF关联的模式在数据中扮演重要角色时,我们的方法经常优于最先进的NBR方法-包括使用RNN的基于深度学习的方法。

1 INTRODUCTION

推荐系统已经在许多不同的应用中得到了应用。NBR是一种推荐问题,其目的是根据用户的历史购物篮 向他/她推荐一组商品,这在电子商务和零售业中非常普遍。与TOP-N推荐(其历史记录是一组项目)[33]和顺序推荐(其历史记录是一系列项目)[31]不同,下一篮子推荐的历史记录是一系列集合或连续集合(其元素是集合)。考虑到历史记录,当NBR只有一个篮子和具有大小都为1的篮子序列时,Top-n推荐和基于顺序/会话的推荐可以被视为NBR的特例。但是在推荐步骤中,top-n推荐只推荐用户历史记录中没有的新项,而顺序/基于会话的推荐和NBR都推荐新项和旧项。尽管顺序/基于会话的推荐类似于NBR,但我们不能直接应用顺序/基于会话的推荐方法来进行NBR,而不会使顺序集合中存在的信息变得混乱。
NBR中最具挑战性的部分是如何对历史记录和推荐项目之间的关系进行建模。现有的NBR方法使用不同的方式来将历史记录中的信息建模为用户简档,并捕获用于预测下一个篮子的用户-项目交互。RNN因其易于为顺序建模进行调整而成为主流选择之一。然而,我们认为现有的RNN不能直接捕获推荐场景中的项目频率信息
最近,重复的行为被发现在顺序/基于会话的推荐[42][35]和NBR[20]中都带来了相当大的性能提升。根据观察,重复购买在用户记录中广泛存在。然而,我们的分析表明,PIF比重复购买模式包含了更多的信息。我们观察到,相似用户的PIF也包含协同购买模式。这一新模式表明,如果用户重复购买一件物品,相似的用户可能会购买相同的物品。现有的方法不能充分利用PIF中包含的这些有用信息。
本文提出了一种简单的基于k-近邻(KNN)的方法,直接捕获与PIF相关的两个有用模式。为了证明该方法的有效性,我们还观察和分析了现有方法在捕捉与PIF相关的重要模式方面的局限性,因为它们不能很好地学习向量加法。综上所述,我们的贡献如下:

  • 我们分析了与PIF和目标篮子相关的两种模式。发现了PIF能够以协作的方式为NBR做出贡献的协作采购模式。
  • 我们发现了RNN在推荐设置中学习向量加法的困难。据我们所知,我们是第一个提出和分析这一现象的。
  • 我们提出了一种简单有效的基于KNN的方法来直接捕获与PIF相关的两个有用模式。该方法还考虑了时间动力学的影响。
  • 我们在四个真实数据集上进行了实验,验证了该方法的有效性。
    论文的其余部分安排如下:第二部分为开场白。在第三节中,我们描述了我们提出的方法。在第四节中,我们讨论了相关的工作。在第五节中,我们对我们的方法进行了评估。第6节提供了一些结束语和未来方向。

2 PRELIMINARIES

在本节中,首先正式定义了NBR问题。接下来,我们分析与NBR的PIF相关的模式。我们对真实世界数据集的分析表明,PIF包含了下一个目标篮子的两个重要信号。最后,对已有的方法进行了总结,并讨论了它们在学习PIF时的难点。

2.1 Problem Definition

在这里插入图片描述
其中在第i个时间步的一组项目(篮子)表示为0/1向量vi,其条目cj
如果(j∈[0,d])设置为1。
相应的项目出现在购物篮中,我们的目标是预测
下一组物品(下一个购物篮)ˆvt + 1。
根据文献[36] [46],我们考虑带有s个项目的固定大小集作为下一个购物篮的推荐。
v是一个篮子

2.22.2 Relation between PIF and Target Basket

在这一部分中,我们将讨论与PIF相关的两个重要模式,它们可以帮助预测下一个篮子的目标:重复采购模式和协作采购模式
从经济学和心理学的角度对杂货店购物和网络活动中的重复购买行为进行了理论和实证研究[2][5][9][22]。该模式已被用于最近的顺序/基于会话的推荐方法[35][42]和NBR方法[20][41]中,并被证明获得了相当大的性能提升。具体地说,推荐特定于用户的最频繁项的简单基线有时可以超过许多现有方法[20]。此基线的良好性能来自这样的假设,即下一个目标篮子通常包含出现在用户历史记录中的项目。并且较高的PIF与相应物品再次出现在目标篮子中的概率较高相关联。然而,这一假设有一个限制,即PIF仅帮助目标用户。它忽略了不同用户之间的协作。这就是协同过滤的核心思想[26]。一个自然的问题是,PIF是否能以协作的方式提供帮助。为了验证这一点,我们在四个真实世界数据集上调查相同项目的共同出现,以同时出现在相似用户的过去篮子和目标用户的下一个篮子中(数据的详细信息在第5.1.1节中)。为了与重复购买模式进行比较,我们还调查了同一物品同时出现在目标用户的过去购物篮和目标用户的下一个购物篮中的共现情况。我们只需使用PIF向量(PI FVector=˝ti=1vi)
来表示每个用户。对于每个用户,基于PIF向量找到他/她的前300个最近邻居(所有数据集中的用户总数不少于10,000)。表示目标用户的过去篮子P中的所有项目的集合。将邻居过去的篮子中所有项目的集合表示为集合N。目标篮子表示为T。我们计算以下四个比率:
在这里插入图片描述
在这里插入图片描述

从表1中,我们可以进行几个观察。首先,RecallP指出,重复购买模式在四个数据集中发挥着相当大的作用,但在不同的数据集之间差异很大。其次,RecallN表明,协作采购模式在所有四个数据集中都扮演着重要得多的角色。它可以帮助检索目标篮子中一半以上的物品。令人惊讶的是,在三个数据集中,这一比例可以增加到0.8以上。请注意,这里我们只使用了300个最近邻居。如果我们增加邻居的数量,预计RecallN会增加。第三,RecallP∩N表明这两种模式存在重叠。基于RecallN−RecallP∩N,我们还可以推断协同采购模式提供了与目标篮子相关的额外信号。第四,Re

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值