ICML2018|基于自注意力的序列推荐模型SASRec(已开源)

最新推荐文章于 2024-08-16 07:51:20 发布

frank_hetest

最新推荐文章于 2024-08-16 07:51:20 发布

阅读量5.5k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hestendelin/article/details/104912648

版权

SASRec是一种结合自注意力机制的序列推荐模型，旨在平衡马尔可夫链和循环神经网络的优点。它能捕捉长序列的语义信息，同时在稀疏和稠密数据集上表现优越，且比CNN和RNN更高效。模型通过注意力机制从用户行为历史中选择相关商品进行预测，实验显示其在多个基准数据集上超越其他序列模型。

摘要由CSDN通过智能技术生成

Self-Attentive Sequential Recommendation

Wang-Cheng Kang, Julian McAuley

UC San Diego

https://cseweb.ucsd.edu/~jmcauley/pdfs/icdm18.pdf

很多现代推荐系统中序列动力学是一种重要特征，序列动力学能够根据用户最近的行为来捕捉用户行动的上下文环境。

现行有两种比较流行的方法来捕捉这种模式，一种是马尔可夫链，一种是循环神经网络。马尔可夫链假设用户的下一个行为可以基于用户的最近一次或者最近几次的行为来预测，循环神经网络在原理上可以发现较长周期的语义信息。

一般而言，基于马尔可夫链的方法在非常稀疏的数据集上效果最好，循环神经网络在比较稠密的数据集中效果较好，模型复杂度也较高。

这篇文章的目标在于对上述两种方法的优势进行平衡，提出一种自注意力序列模型（SASRec），该模型可以像循环神经网络一样捕捉较长的语义信息，不同的是，加入了注意力机制，这就使其能够基于相对较少的行为来作出预测，这一点有点类似马尔可夫链。

每一步中，SASRec从用户行为历史中寻找比较相关的商品，并且利用它们来预测下一个商品。

大量实验表明，本文方法在稀疏和稠密数据集上的效果优于其他STOA序列模型，比如基于马尔可夫链的方法，基于卷积神经网络的方法，以及基于循环神经网络的方法。

并且，该模型相对基于CNN或RNN的模型效率高一个数量级。针对注意力权重的可视化表明了本文模型能够自适应处理多种数据，在行为序列中也能发现比较有意思的模式。

这篇文章的思想源于Transformer

整体结构图示如下

下面是一些符号约定

嵌入部分考虑了位置因素

缩放后的点积注意力定义形式如下

自注意力层形式如下

基于因果关系的改进方式如下

点式前向神经网络形式如下

最低0.47元/天解锁文章

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。