论文《Explainable Session-based Recommendation with Meta-path Guided Instances and Self-Attention Mechanism》阅读
论文概况
今天带来的是南开的关于会话推荐可解释性的论文《Explainable Session-based Recommendation with Meta-path Guided Instances and Self-Attention Mechanism》, 论文通过 meta-path 构造 传播路径,通过自注意力网络(Self-Attention Network,SAN)计算路径间节点相互影响分数,通过“可解释性”完成了整片作品的串联。文章发表在SIGIR 2022, 是一篇短文,完成度一般,建议别看。
下面进行详细介绍。
方法论
作者首先选定窗口
ϵ
\epsilon
ϵ , 对应邻接物品集合表示为:
S
=
{
i
k
+
1
,
i
k
+
2
,
⋯
,
i
k
+
ϵ
}
S = \{i_{k+1}, i_{k+2}, \cdots, i_{k+\epsilon}\}
S={ik+1,ik+2,⋯,ik+ϵ} 。
Embedding 部分通过DeepWalk预训练模型完成初始化。这里好像还有一个
通过多头SAN完成路径内注意力系数的计算(怎么保证路径长短一致没有说)(这里好像还有一个多个meta-path示例的下采样过程,说通过相似性进行判断,具体相似性咋判断也没有说,下采样到多少也没说,总之就是啥也没说)。
通过多条路径线性变换加点乘,通过平均池化将多个meta-path合并成一个物品的embedding表示。
通过对session内的物品向量进行拼接,外加一个MLP(MLP细节也啥都没说),完成最后的预测。损失函数使用交叉熵二分类完成。
总结
最后的可解释性部分也没看懂是个啥,如果没有元路径覆盖到session里边的物品如何解释?最后的case study也没看明白那个权重是咋来的,如果一个物品有meta-path涉及到可以通过路径的采纳可行性进行判断,那没有呢?
总之没太看明白,感觉就是加了个“可解释性”的帽子,方法不具有太大创新性。另外,论文中的数学表达不具有连贯性,符号也没有进行详细交代,阅读上不太友好。
可能是我理解不太到位,欢迎各位同学评论区指教。