AAAI2023 | 均匀序列更好: 时间间隔感知的序列推荐数据增强方法

本文研究了时间间隔对序列推荐的影响,发现均匀序列能提升模型性能。作者提出了5种时间间隔感知的数据增强算子,以改善非均匀序列,实验证实在4个数据集上提高了推荐精度。
摘要由CSDN通过智能技术生成

嘿,记得给“机器学习与推荐算法”添加星标


TLDR:本文探讨了时间间隔对序列推荐的影响。作者的核心思想是均匀序列对于模型学习和预测用户偏好更具价值,这一假设在实证研究中得到验证。之后,作者提出了五种时间间隔感知的数据增强算子来增强序列。作者在四个公开数据集上的实验验证了作者提出算子的有效性。

e299516eb4132c7dab02d9e1cf1a7c99.png

链接:https://arxiv.org/abs/2212.08262
代码:https://github.com/KingGugu/TiCoSeRec

内容简介

序列推荐已经成为一项重要的推荐任务,根据用户的历史交互序列预测下一个时间点用户访问的项目。作者发现序列中两个项目交互的时间间隔并没有得到广泛的关注,特别是考虑到兴趣偏移时。图1是从真实数据集中抽取的一个例子。两个用户拥有相同长度的交互序列,但他们交互间隔的分布却相差很多。用户1的时间间隔分布相对用户2更为均匀。用户1购买的大多数产品都属于皮肤/面部护理类别,而用户2购买的产品类别却随着时间发生了较大的改变(从发胶到睫毛膏,从睫毛膏到保湿霜)。直观地认为,由于用户1的序列比其他用户分布更均匀,因此模型可以更好地学习用户偏好。作者将用户1这种序列称为“均匀序列”,用户2称为“非均匀序列”。

12e8f57e06185fc7dc415c032861dbc5.png

在本文中,作者进行了实证研究来进一步验证这一猜想。实验结果表明,均匀序列比非均匀序列可以显著提高模型性能,然而,真实数据集中序列在时间间隔上不能均匀分布是一个很普遍的现象。基于实证研究的结果,作者提出了五个时间间隔感知的数据增强算子(Ti-Crop, Ti-Reorder, Ti-Mask, TiSubstitute, Ti-Insert)来将非均匀序列转换为均匀序列。此外,作者应用对比学习来确保增强序列与原始序列保持较高的相似性。作者在一个最先进推荐模型CoSeRec上实现了作者的方法,并提出了TiCoSeRec。

本文的主要贡献有:

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值