【论文笔记】SIGIR2020 Rethinking Item Importance in Session-based Recommendation

最新推荐文章于 2021-12-24 15:54:55 发布

Yo3ngLau

最新推荐文章于 2021-12-24 15:54:55 发布

阅读量327

点赞数

分类专栏：深度学习推荐系统文章标签：深度学习推荐系统会话推荐

本文链接：https://blog.csdn.net/weixin_43359312/article/details/115000648

版权

深度学习推荐系统专栏收录该内容

9 篇文章 1 订阅

订阅专栏

PROBLEM

现有工作不能充分注意到不同items与用户主要兴趣的相关性.

SOLUTION

同时考虑当前session用户的长短期偏好，应用修正的自监督机制评估item在当前session的重要性，以预测用户的长期偏好，短期偏好则由当前session最后交互item表示.

APPROACH

Framework

在这里插入图片描述

Importance extraction

将item embedding $E=\{e_1,e_2,\dots,e_t\}$ 通过非线性函数转换到不同空间以生成 $\ Q$ 和 $\ K$ ：
$\begin{aligned} Q&=\text{sigmoid}(W_qE), \\ K&=\text{sigmoid}(W_kE) \tag{1,2} \end{aligned}$
其中 $W_qE \in \mathbb{R}^{d \times l}$ 和 $W_kE \in \mathbb{R}^{d \times l}$ 是可训练的参数， $l$ 是注意力机制的维度.

通过引入 $\ Q$ 和 $\ K$ 的关联矩阵 $C$ 计算每两个item间的相似度：
$C=\frac{\text{sigmoid}(QK^T)}{\sqrt{d}} \tag{3}$

将session内一个item和其他items间的平均相似度作为该item重要性，为避免 $\ Q$ 和 $\ K$ 相同向量的高匹配得分，采取将关联矩阵 $C$ 的对角元素mask的操作，则每个item $i$ 的重要性得分 $\alpha_i$ ：
$\alpha_i=\frac{1}{t}\sum_{j=1,j \ne i}^{t}C_{ij} \tag{4}$
其中 $C_{ij} \in C$ .
归一化得分，最终当前session的items的重要性表示为：
$\beta=\text{softmax}(\alpha) \tag{5}$

Preference fusion

用户长期偏好表示：
$z_l=\sum_{i=1}^t \beta_i e_i \tag{6}$
用户短期偏好由最后一个item表示，即 $z_s=e_t$ .
用户最终偏好表示：
$z_h=W_0[z_l;z_s] \tag{7}$
其中 $W_0 \in \mathbb{R}^{d \times 2d}$ 将拼接表示从 $\mathbb{R}^{2d}$ 转换到 $\mathbb{R}^d$ .

Item recommendation

对于每一item $v_i$ ，用户的偏好得分为：
$\hat{z_i}=z_h^Te_i \tag{8}$
归一化得分：
$\hat{y}=\text{softmax}(\hat{z}) \tag{9}$
交叉熵作为优化目标：
$L(\hat{y}=-\sum_{i=1}^ny_i\log (\hat{y}_i)+(1-y_i)\log (1- \hat{y}_i) \tag{10}$

EXPERIMENTS

Overall performance

在这里插入图片描述

Impact of session length

在这里插入图片描述

Analysis on importance extraction module

在这里插入图片描述

Yo3ngLau

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
【论文笔记】SIGIR2020 Rethinking Item Importance in Session-based Recommendation

PROBLEM现有工作不能充分注意到不同items与用户主要兴趣的相关性.SOLUTION同时考虑当前session用户的长短期偏好，应用修正的自监督机制评估item在当前session的重要性，以预测用户的长期偏好，短期偏好则由当前session最后交互item表示.APPROACHFrameworkImportance extraction将item embedding E={e1,e2,…,et}E=\{e_1,e_2,\dots,e_t\}E={e1,e2,…,et}通过非线性
复制链接

扫一扫