【序列推荐】CIKM2020|S3---基于自监督学习的序列推荐模型

最新推荐文章于 2024-01-07 02:04:24 发布

Blank_spaces

最新推荐文章于 2024-01-07 02:04:24 发布

阅读量1.4k

点赞数 1

文章标签： python 机器学习人工智能深度学习计算机视觉

本文链接：https://blog.csdn.net/Blank_spaces/article/details/113577932

版权

本文介绍了CIKM2020会议上发表的S3模型，该模型通过自监督学习和互信息最大化来改进序列推荐。作者针对传统模型存在的数据稀疏性和上下文关联性不足的问题，提出四种关联关系（item-attribute，sequence-item, sequence-attribute, sequence-segment）的互信息损失函数，以增强item embedding。通过预训练和微调，S3模型在多个数据集上表现出优越的推荐性能。" 138053359,22927224,Android Studio Profile 功能闪退问题分析,"['Android开发', 'Android studio', '调试']

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

文章发表在2020年CIKM会议上，与以往分享的端到端的模型不同，文章基于互信息最大化（mutual information maximization）原则，提出了一个自监督的序列推荐模型（预训练），来增强序列推荐中数据表示（item embedding），最终提供一个更高质量的推荐效果。
本文约2.4k字，预计阅读10分钟。

概要

对于当前的序列推荐模型，作者提出存在的两个缺点：

模型依赖于物品预测损失来学习模型，当上下文数据被纳入后，所涉及的参数也通过唯一的优化目标学习。研究发现【FPMC，AutoInt论文】，这种优化方法容易受到数据稀疏等问题的困扰；【有点难以理解】
模型过分强调了最终的性能，而上下文数据和序列数据之间的关联在数据表示中没有得到很好的捕捉；

针对这两个问题，作者想采用「自监督学习模型」来提高序列推荐的性能。

❝
自监督模型可以利用数据内在相关性来设计辅助训练目标（重新定义优化的目标），并通过自监督信号的预训练方法来增强数据表示。
❞

因此，作者提出一个自监督学习模型---「S3」（self-supervised sequential recommendation model），以自注意力机制为模型架构的基础，互信息最大化（MIM）为优化目标，四种关系（item-attribute，sequence-item, sequence-attribute sequence subsequence）为具体内容。另外，通过预训练得到的item embedding，输入到微调模型（这里作者选择了SASRec的结构）训练。

【注】总结来说，采用自监督的预训练方式最大的好处就是更方便的融合上下文特征，采用其他的训练目标（例如互信息最大化）能从其他角度捕捉物品与上下文特征的相关性。