嘿,记得给“机器学习与推荐算法”添加星标
TLDR:本文探讨了时间间隔对序列推荐的影响。作者的核心思想是均匀序列对于模型学习和预测用户偏好更具价值,这一假设在实证研究中得到验证。之后,作者提出了五种时间间隔感知的数据增强算子来增强序列。作者在四个公开数据集上的实验验证了作者提出算子的有效性。
链接:https://arxiv.org/abs/2212.08262
代码:https://github.com/KingGugu/TiCoSeRec
内容简介
序列推荐已经成为一项重要的推荐任务,根据用户的历史交互序列预测下一个时间点用户访问的项目。作者发现序列中两个项目交互的时间间隔并没有得到广泛的关注,特别是考虑到兴趣偏移时。图1是从真实数据集中抽取的一个例子。两个用户拥有相同长度的交互序列,但他们交互间隔的分布却相差很多。用户1的时间间隔分布相对用户2更为均匀。用户1购买的大多数产品都属于皮肤/面部护理类别,而用户2购买的产品类别却随着时间发生了较大的改变(从发胶到睫毛膏,从睫毛膏到保湿霜)。直观地认为,由于用户1的序列比其他用户分布更均匀,因此模型可以更好地学习用户偏好。作者将用户1这种序列称为“均匀序列”,用户2称为“非均匀序列”。
![12e8f57e06185fc7dc415c032861dbc5.png](https://i-blog.csdnimg.cn/blog_migrate/37cc988942a272d32f75513feb44c8b8.png)
在本文中,作者进行了实证研究来进一步验证这一猜想。实验结果表明,均匀序列比非均匀序列可以显著提高模型性能,然而,真实数据集中序列在时间间隔上不能均匀分布是一个很普遍的现象。基于实证研究的结果,作者提出了五个时间间隔感知的数据增强算子(Ti-Crop, Ti-Reorder, Ti-Mask, TiSubstitute, Ti-Insert)来将非均匀序列转换为均匀序列。此外,作者应用对比学习来确保增强序列与原始序列保持较高的相似性。作者在一个最先进推荐模型CoSeRec上实现了作者的方法,并提出了TiCoSeRec。
本文的主要贡献有: