RecSys行为序列建模-GRU4Rec

GelaBute

已于 2024-08-07 16:45:51 修改

阅读量3.3k

点赞数 24

分类专栏：行为序列建模文章标签：深度学习 session

于 2021-06-23 19:35:20 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41196438/article/details/118157016

版权

行为序列建模专栏收录该内容

4 篇文章

订阅专栏

该博客介绍了使用GRU4Rec模型进行推荐系统序列建模的方法。模型通过RNN堆叠捕获会话序列信息，预测下一个点击项。优化策略包括：SESSION-PARALLEL MINI-BATCHES确保会话内连续性和独立性，以及SAMPLING ON THE OUTPUT进行局部负采样以加速训练。损失函数采用了BPR和TOP1。这些技术提升了基于单次会话推荐的效率和准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

推荐系统行为序列建模-GRU4Rec

《SESSION-BASED RECOMMENDATIONS WITH RECURRENT NEURAL NETWORKS》论文基于单次会话session进行推荐。

1.模型结构

在这里插入图片描述
整体结构比较简单，通过RNN的堆叠来抽取序列信息

input：单次会话的点击序列 $x_1, x_2,...x_n]$
output：时间节点i之后的下一个被点击item $x_{i+1}$

初始embedding是对会话点击序列的编码，通过最后一层GRU后，获得对当前会话序列的整体建模 $w_1$ ，之后可以视为与候选item编码构成的矩阵 $w_2$ 作用得到对各候选item的推荐倾向

2.优化

为了加速训练，作者提出了两个trick：

2.1 SESSION-PARALLEL MINI-BATCHES

GRU4Rec聚焦于单个Session的演变，碎片化Session没有意义
在这里插入图片描述
为了保证Session内的连续性和Session间的独立性：

同一Mini-batch并行运算，不同的按序串行
切换Session时，重置GRU隐变量(如 $i_{1,3}$ 到 $i_{5,1}$ 时)

2.2 SAMPLING ON THE OUTPUT

item数量太多负采样困难，选取了同一个batch 中其他 Session 下一个点击的 item 作为负样本，局部负采样

3.Loss

BPR： $-\frac{1}{N_{s}}\sum_{j=1}^{N_{s}}log(\sigma(\hat{r}_{s,j} > \hat{r}_{s,i}))$
TOP1: $-\frac{1}{N_{s}}\sum_{j=1}^{N_{s}}\sigma(\hat{r}_{s,j} > \hat{r}_{s,i}) + \sigma(\hat{r}_{s,j}^2)$

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。