KDD2020|序列推荐中的解纠缠自监督学习

最新推荐文章于 2023-07-12 22:06:16 发布

EdmundYan

最新推荐文章于 2023-07-12 22:06:16 发布

阅读量919

点赞数

分类专栏： KDD2020 论文阅读文章标签：深度学习推荐系统阿里巴巴

本文链接：https://blog.csdn.net/EdmundYan/article/details/117879825

版权

论文阅读同时被 2 个专栏收录

12 篇文章 2 订阅

订阅专栏

KDD2020

9 篇文章 1 订阅

订阅专栏

Disentangled Self-Supervision in Sequential Recommenders

背景

现在大多数的序列推荐都是使用seq2item的推荐，以用户的下一个行为为标签输入为用户的点击历史序列。这样带来的结果是短视的，并且没法产生多样化的推荐列表。文章中提出，使用seq2seq的训练方法，使用用户的历史序列来预测用户的未来点击序列可能是比seq2item鲁棒性更好的训练方法。但是这其中有两个问题，首先是构造多个行为的未来序列要比预测单个item要困难，并且可能无法收敛；其次是用户未来的行为可能包含多个意图，并非每个意图都可以从早期的行为中预测出来。文章后续的部分都是在说明如何解决这两个问题。

序列到序列的自监督

左边是传统的seq2item预测策略，使用用户的历史行为预测下一次点击，右边是论文中提出的seq2seq方法，使用前后相同的用户意图来自监督的学习预测用户后续的seq表示。

文中提出了一个序列编码器，可以将输入序列编码到k个D维的向量空间中，每个D维的向量表示用户的某个意图(兴趣)，ps：这里感觉又有点muti-interest的味道了，看来最近业界的工作都集中在这一块，已经看到3篇用多兴趣建模用户的了。然后如果输入序列和生成的对应序列间有同样的意图，就会对其进行Loss的反向传播，这里文中将seq2seq Loss定义为：

总的损失使用了seq2seq Loss加上seq2item Loss：

解纠缠的序列编码

简单来说就是计算用户每个意图(intension)与事先定义好的意图原型之间的距离，计算用户意图属于不同事先定义意图的概率：

实验

文章做了很多实验，分别是推荐性能、seq2seq训练方法对于噪声的敏感性和消融实验。

推荐上，文中的模型对比baseline和SOAT均取得了最佳的效果。

对于噪声，文中在beauty数据集上随机替换物品的标签，产生不同比例的噪声，结果证明，使用了seq2seq的损失函数对噪声更鲁棒。

消融实验的结果证明了，使用seq2seq和对用户后续序列的数据采样方式上，文中的方法都是有效的。

结论

文章提出了seq2seq的预测场景，并对用户意图进行分析和自监督的训练，证明了seq2seq预测对比seq2item的优越性。

Ref:Ma J, Zhou C, Yang H, et al. Disentangled Self-Supervision in Sequential Recommenders[C]//Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2020: 483-491.