Modeling Personalized Item Frequency Information for Next-basket Recommendation
https://arxiv.org/pdf/2006.00556.pdf
问题定义
推荐中存在TOP-N推荐,就是返回给用户前N个其可能感兴趣的物品列表;有基于序列推荐的next-item推荐,就是预测用户下一个最可能点击的物品;还有下个篮子推荐(next basket rec),简单来说一个篮子就是包括n个物品的一个集合,并且篮子中的物品可以在用户的先前购买行为中出现过。序列推荐的next-item推荐可以理解为NBR的一种特殊情况,就是篮子大小为1。
背景
个性化项目频率(Personal Item Frequency)信息(记录用户购买每个项目的次数)蕴含着很大的信息量,并且重复的购买行为大量的出现在用户记录中。但是经过文中的实验证明,基于RNN的时序推荐方法没法很好的捕捉PIF的信息,所以作者提出了使用物品频率的最近邻(knn)推荐方法来使用PIF信息。
对RNN没法学习PIF信息的实验
文中的方法很简单,但是在证明RNN没法学习PIF信息的实验上做的还是比较精彩的。
用RRN模型做NBR推荐的概念图,通过对每个篮子中物品的embedding做sum pool之后输入RNN结构最后得到用户的表示。
RNN对于学习向量加法的困难:通过生成多个one-hot向量,输入篮子中,序列长度固定为10,其中有8个篮子是不同的,其余两个篮子为从8个篮子中采样得到,是为了模拟PIF用户重复购买行为。实验发现RNN的模型没法很好的模拟矩阵加法,收敛不到最优解。而后证明了RNN没法学习到PIF的信息。
基于最近邻的方法
文中不使用RNN结构,而是使用了一个基于时间衰减的多个系数对用户篮子序列进行加权得到用户表示(方法非常水)。就是把用户序列划分为n个组,每个组有k个篮子,对每个组有个不同的基于时间的系数,加权后就是用户表示,如下图:
预测:通过目标用户Ut表示和与他距离最近的k个用户的表示Un,计算P,然后计算对应的item
实验
在四个数据集上测试了提出的方法,可以看到个性化的用户最常购买物品推荐方案对比其他方法均取得了最佳的效果,证明PIF信息的有效性。
而对与用户表示和近邻用户表示的使用也进行了测试,证明两部分对预测都有贡献:
结论
提出了使用PIF信息学习用户表示,利用邻居信息和用户自身信息计算用户的下一个点击桶。我觉得这篇文章方法非常水,但是对于RNN没法学习PIF信息做了实验证明可能是这篇文章的一个亮点。
Ref:Hu H, He X, Gao J, et al. Modeling personalized item frequency information for next-basket recommendation[C]//Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. 2020: 1071-1080.