GRU4Rec学习笔记（SESSION-BASED RECOMMENDATIONS WITHRECURRENT NEURAL NETWORKS）

最新推荐文章于 2024-09-16 16:29:28 发布

jingjing~

最新推荐文章于 2024-09-16 16:29:28 发布

阅读量1.1k

点赞数 2

文章标签：深度学习人工智能 python embedding 推荐算法

本文链接：https://blog.csdn.net/zhu_xian_gang/article/details/134722767

版权

1、session-parallel mini-batch

一、摘要

主要是对RNN的一个改进，针对RNN在用到推荐系统时，会面临会话时间短的问题，而不是长期会话，导致精度不准，为了解决这个问题，作者通过对整个会话进行建模。

二、引言

第一段：主要讨论了在机器学习和推荐领域忽视的问题（会话推荐），提出现有会话的缺点如cookie和游览器指纹，这些技术是不可靠的，电商部署的多为简单的方法，不使用用户资料，通过物品与物品的相似性、共现关系或转换概率，但是它们通常只考虑了最后一次的点击或选择，而忽略了过去点击的信息。

在推荐系统或信息检索领域，" 共现关系"指的是两个或多个物品（或项目）在用户行为中同时出现的频率或概率。如果用户在一次行为中选择了物品A，而在另一次行为中选择了物品B，那么我们就说物品A和物品B在用户行为中有共现关系。这种关系可以用于推断物品之间的相似性或关联性。

在推荐系统或信息检索领域， "转换概率"（切换选择下一个物品的概率）通常指的是用户在一个时间点选择某个物品后，在下一个时间点选择另一个物品的概率。这个概率反映了用户在不同物品之间切换的趋势或倾向。

第二段：主要介绍了两种方法，因子模型（Factor Models）和邻域方法（Neighborhood Methods），前者通过将稀疏矩阵分解再重建，由于在会话推荐缺少个人信息，较难应用，后者通过计算物品或用户间的相似性，这种在会话推荐得到了广泛应用。

第三段：说了近些年深度神经网络在图像和语音识别方面的成功，各种各样的RNN成为顺序建模的首选，序列模型包括了文本翻译、对话建模和图像描述等。也就是 RNN在其它方面应用的成功

第四段：讨论在推荐系统应用RNN的问题和方法，作者提出了会话推荐（session-based recommendation）说明了处理稀疏序列的问题，以及引入排名损失函数来调整RNN模型， RNN的初始输入为用户第一次点击第一个物品，每个连续的点击都会依赖之前所有点击输出，另外点击序列的数据非常庞大，对于培训时间和可伸缩性非常重要。

三、推荐的RNN/GRU

RNN:ht 是在时间步的隐藏状态,g是光滑有界的激活函数（sigmoid），W为隐藏层的权重矩阵，xt是时间t时单位的输入， U是上一个时间步到当前时间步的权重。

更新门

重置门

候选隐藏层

隐藏层

输出

四、自定义GRU模型

模型的输入是当前会话的状态，输出是会话中下一个事件的物品，为了稳定性对输入向量进行了归一化，在输入和第一层GRU之间新增嵌入层，在最后一层和输出之间新增前馈层（Feedforward layers 也称全连接层或密集层）。因为推荐系统不是递归神经网络的主要应用领域，因此修改了基本网络，为了更好的适应任务。

1-of-N coding 就是 one-hot编码

五、本文亮点

1、session-parallel mini-batch

会话并行在mini-batch中，处理长度的两种策略（1）按照长度排序，这样padding（填充）会相对较少（2）对长的进行截断或者剪裁，显然两种策略都不合适，因为在推荐系统中，长的和短的序列差异极大，因此作者提出session并行概念，如图，分成3个并行，当一个序列并行结束后，将新的序列补进来，甚至不需要padding。