“DIGAT: Modeling News Recommendation with Dual-Graph Interaction” DIGAT:用双图互动建立新闻推荐模型
- 缺点
- 首先,在新闻编码器中,单一候选新闻编码存在着语义信息不足的问题。
- 其次,现有的基于图的NR方法很有前景,但缺乏有效的新闻-用户特征互动,使基于图的推荐变得不理想。
- 创新点
为了克服这些限制,我们提出了由新闻和用户图形通道组成的双交互式图形关注网络(DIGAT)
在新闻图渠道中,我们通过将语**义相关的新闻信息与语义增强图(SAG)**结合起来,丰富了单个候选新闻的语义。
在用户图谱渠道中,多层次的用户兴趣在新闻主题图中得到了体现
-
2.Introduction
-
遇到的困难
首先,在新闻编码器中,单个候选新闻的编码存在语义信息不足的问题。与普通推荐中的长期项目(如电子商务产品推荐)不同,候选新闻项目是短期的,存在着冷启动问题。
另一方面,与用户编码器中丰富的历史点击新闻相比,单一的候选新闻可能不包含足够的语义信息,无法在点击预测阶段进行准确的新闻-用户表述匹配。
这些工作的重点是如何从用户图谱方面提取细粒度的表征,但忽略了候选新闻和用户图谱之间必要的特征互动。
-
DIGAT(双交互图式注意网络)
DIGAT由新闻和用户图形通道组成,分别对候选新闻和用户历史进行编码。
- 新闻图引入了语义增强图(SAG)建模,以丰富单一候选新闻的语义表示
- 在用户图谱渠道,受Mao等人(2021)和Wu等人(2021)的启发,我们用新闻主题图对用户历史进行建模,以代表多层次的用户兴趣。
-
3.Approach
-
问题定义:
用户u的点击历史
H u = [ n 1 , n 2 , . . . , n ∣ H ∣ ] ( ∣ H ∣ 为用户点击新闻的个数) Hu = [n1, n2, ..., n|H|] (|H|为用户点击新闻的个数) Hu=[n1,n2,...,n∣H∣](∣H∣为用户点击新闻的个数)
- 新闻n的单词数目
T n = [ w 1 , w 2 , . . . , w ∣ T ∣ ] Tn = [w1, w2, ..., w|T |] Tn=[w1,w2,...,w∣T∣]
|T|为单词数量
基于 T n Tn Tn和 H n Hn Hn来预测对候选新闻ncan的点击概率
-
然后,我们使用Transformer编码器(Vaswani等人,2017)的多头自我注意网络MSA(Q,K,V)来学习上下文表征
H n ∈ R ∣ T ∣ × d ( 其中 d 为特征维度 ) Hn ∈ R|T |×d (其中d为特征维度) Hn∈R∣T∣×d (其中d为特征维度)
值得注意的是,我们框架中的语义新闻编码器是即插即用的,它可以很容易地被任何其他文本编码器或预训练的语言模型所取代,例如BERT(Devlin等人,2019)或DeBERTa(He等人,2021)。
-
-
3.2新闻语义增强图(SAG)的构建和图文学习
-
新闻图构造
语义相关的新闻检索
我们利用PLM φ(·)从训练新闻语料库中检索语义相关的新闻,以增加原始单一候选新闻的语义信息。
在检索过程中,新闻ni和nj(对应文本Ti和Tj)的语义相似度分数si,j由相似度函数sim(-, -)计算出来:
s i , j = s i m ( n i , n j ) = c o s i n e ( φ ( T i ) , φ ( T j ) ) si,j = sim(ni, nj ) = cosine(φ(Ti), φ(Tj)) si,j=sim(ni,nj)=cosine(φ(Ti),φ(Tj))
语义增强图
对于原始候选新闻ncan,我们将其初始化为语义增强新闻图Gn的根节点v0。
在每个图的构建过程中,对于Gn的一个现有节点vi(对应的新闻Ni),从新闻语料库{Nj}jM=1中检索出M个具有最高语义相似度分数{si,j}jM=1的新闻文件。我们通过在节点vi之间添加双向边{ei,j}jM=1来扩展节点{vj}jM=1作为邻居节点。
-
新闻图谱语境提取
-
-
3.3用户图编码
-
用户图构造
(1) 对于用户点击的新闻Hu = [n1, n2, …, n|H|],我们将其视为一组新闻节点,用于新闻层面的用户兴趣表示。
(2) 对于被点击的新闻nj,它与一个特定的新闻主题t(i)有关。我们将被点击的新闻话题视为主题节点,用于话题层面的用户兴趣表达。
为了捕捉新闻和话题之间的互动,我们引入了三种类型的边:
新闻-新闻边。具有相同主题类别(例如,体育)的新闻节点是完全连接的。通过这种方式,我们可以用新闻层面的互动来捕捉被点击的新闻之间的关联性。
新闻-话题边。我们通过连接新闻节点和其相关的话题节点来模拟点击的新闻和话题之间的关联。
主题-主题边。主题节点是完全连接的。通过这种方式,我们可以用话题级的互动来捕捉用户的整体兴趣。
-
用户图语境提取
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZuvArane-1673345822674)(attachments/KBXJXZYX.png)]
-
3.4双图交互
-
-