PROBLEM
作者指出当前的基于GNN的推荐模型存在popularity bias,模型偏向推荐流行items,不能很好地推荐相关的long-tail items(不太流行或不太频繁出现的items),图一描绘了items流行度的经典长尾分布.
如图三,高流行度的items有着较高的
L
2
norm
\text{L}_2 \ \text{norm}
L2 norm ,然而较低流行度的items有极低的
L
2
norm
\text{L}_2 \ \text{norm}
L2 norm
SOLUTION
作者旨在激发训练和预测时约束item和session-graph表示在一个单位超球面的优势,具体而言,提出使用cosine similarity作为item和session embeddings间相似度的衡量方法,而非以往的inner product.
在训练和预测阶段,归一化item embeddings如下:
i
~
k
=
i
k
∣
∣
i
k
∣
∣
2
\bf{\tilde{i}}_k=\frac{\bf{i}_k}{||\bf{i}_k||_2}
i~k=∣∣ik∣∣2ik
以此获得items集
I
~
s
\bf{\tilde{I}_s}
I~s,则session embedding
s
=
f
(
I
~
s
;
θ
)
\textbf{s}=f(\bf{\tilde{I}_s};\bm{\theta})
s=f(I~s;θ),同理获得归一化的session embeddings
s
~
\bf{\tilde{s}}
s~,
θ
\bm{\theta}
θ是映射items到session embedding的函数
f
f
f的参数,预测点击item
i
k
i_k
ik的得分:
y
k
^
=
exp
(
σ
i
~
k
T
s
~
)
∑
j
=
1
m
exp
(
σ
i
~
j
T
s
~
)
\hat{\textbf{y}_k}=\frac{\exp(\sigma \tilde{\textbf{i}}_k^T\tilde{\textbf{s}})}{\sum_{j=1}^m \exp (\sigma \tilde{\textbf{i}}_j^T\tilde{\textbf{s}})}
yk^=∑j=1mexp(σi~jTs~)exp(σi~kTs~)
注意cosine similarity
i
k
T
s
~
\textbf{i}_k^T\tilde{\textbf{s}}
ikTs~被约束在
[
−
1
,
1
]
[-1,1]
[−1,1].
EXPERIMENT
NISER+表示带有position embeddings和dropout的NISER.