论文《Neural Attentive Session-based Recommendation》阅读

wzj1212123

于 2022-12-03 11:05:02 发布

阅读量590

点赞数

文章标签：算法人工智能

本文链接：https://blog.csdn.net/wzj1212123/article/details/128158027

版权

论文《Neural Attentive Session-based Recommendation》阅读

论文概况
Introduction
Method
总结

论文概况

本文是2017年ICKM上的一篇论文，通过使用GRU时序门控单元处理序列化的会话，结合局部和全局编码操作，最终对用户行为进行预测。

Introduction

作者提出问题

现阶段模型只重视会话本身，而没有挖掘用户的意图，例如：

有效的推荐应该如图a，因为用户浏览了衣服裤子，那很可能再买一双鞋来搭配，而现阶段模型更倾向于图b，单纯去比较带推荐物品与会话中物品的相似程度来排序，因此只会推荐衣服和裤子。
对于上述问题，作者提出了NARM模型（Neural Attentive Recommendation Machine）：
(1) 该模型考虑了用户在当前会话中的顺序行为和主要目的
(2) 应用注意力机制来提取用户在当前会话中的主要目的

Method

在这里插入图片描述

A.Global Encoder in NARM

在全局编码器中，输入是整个先前的单击，而输出是用户在当前会话中的顺序行为的特征。输入和输出均由高维向量统一表示。
$\boldsymbol{h}_{t-1}$ 为上一轮activation， $\widehat{\boldsymbol{h}}_t$ 为候选activation，新一轮的更新公式为：
$\boldsymbol{h}_t=\left(1-\boldsymbol{z}_t\right) \boldsymbol{h}_{t-1}+\boldsymbol{z}_t \widehat{\boldsymbol{h}}_t\tag{1}$
其中 $z_t$ 更新公式为：
$\boldsymbol{z}_t=\sigma\left(\boldsymbol{W}_z \boldsymbol{x}_t+\boldsymbol{U}_z \boldsymbol{h}_{t-1}\right)\tag{2}$
候选activation $\widehat{\boldsymbol{h}}_t$ 计算公式为：
$\widehat{\boldsymbol{h}}_t=\tanh \left[\boldsymbol{W} \boldsymbol{x}_t+\boldsymbol{U}\left(\boldsymbol{r}_t \odot \boldsymbol{h}_{t-1}\right)\right]\tag{3}$
更新门 $\boldsymbol{r}_t$ 计算方式为
$\boldsymbol{r}_t=\sigma\left(\boldsymbol{W}_r \boldsymbol{x}_t+\boldsymbol{U}_r \boldsymbol{h}_{t-1}\right)\tag{4}$
全局编码为整体会话经过gru处理的结果
$\boldsymbol{c}_t^{\mathrm{g}}=\boldsymbol{h}_t\tag{5}$
然而，这种全局编码器有其缺点，例如整个序列行为的矢量概括通常难以捕捉当前用户的精确意图。

B.Local Encoder in NARM

如图三所示，为了探寻用户短期意图，我们对gru每一轮的输出进行单独处理
$c_t^1=\sum_{j=1}^t \alpha_{t j} \boldsymbol{h}_j\tag{6}$
其中加权因子α确定在进行预测时应强调或忽略输入序列的哪个部分，α通过计算 $\boldsymbol{h}_t$ 与 $\boldsymbol{h}_j$ 的相似度来决定
$\alpha_{t j}=q\left(\boldsymbol{h}_t, \boldsymbol{h}_j\right)\tag{7}$
$q\left(\boldsymbol{h}_t, \boldsymbol{h}_j\right)=\boldsymbol{v}^{\mathrm{T}} \sigma\left(\boldsymbol{A}_1 \boldsymbol{h}_t+\boldsymbol{A}_2 \boldsymbol{h}_j\right)\tag{8}$

C. NARM Model

最终用户喜好表示为全局与局部编码的级联
$\boldsymbol{c}_t=\left[\boldsymbol{c}_t^{\mathrm{g}} ; \boldsymbol{c}_t^{\mathrm{l}}\right]=\left[\boldsymbol{h}_t^{\mathrm{g}} ; \sum_{j=1}^t \alpha_{t j} \boldsymbol{h}_t^{\mathrm{l}}\right]\tag{9}$
使用点乘计算相似度的方式来给物品打分
$S_i=e m b_i^{\mathrm{T}} \boldsymbol{B} \boldsymbol{c}_{\boldsymbol{t}}\tag{10}$
其中B为|D|*|H|维度的可学习矩阵
最后损失函数设定为交叉熵函数：
$q)=-\sum_{i=1}^m p_i \log \left(q_i\right)\tag{11}$
其中q是预测概率分布，p是真实分布。

总结

NARM不仅提取了会话的序列化信息，还通过gru表达了用户的意图，将会话整体特征与用户意图相结合来解决会话推荐问题。

wzj1212123

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文《Neural Attentive Session-based Recommendation》阅读

本文是2017年ICKM上的一篇论文，通过使用GRU时序门控单元处理序列化的会话，结合局部和全局编码操作，最终对用户行为进行预测在全局编码器中，输入是整个先前的单击，而输出是用户在当前会话中的顺序行为的特征。输入和输出均由高维向量统一表示。ht−1\boldsymbol{h}_{t-1}ht−1为上一轮activation，h^t\widehat{\boldsymbol{h}}_tht为候选activation，新一轮的更新公式为：ht=(1−zt)ht−1+zth^t(1)\bo
复制链接

扫一扫