近期知识图谱顶会论文推荐,另附超详笔记解读

本文汇总了WSDM 2019、NeurIPS 2018、WWW 2018和COLING 2018等知识图谱相关论文的解读,涵盖链接预测、新闻推荐、多关系问答和视觉问题回答等多个领域。重点介绍了基于spring-electrical模型的链接预测方法、DKN(Deep Knowledge-aware Network)新闻推荐模型、可解释推理网络(IRN)和VQA的推理链方法。这些模型在各自领域展现出优越性能,尤其在低维度表示和可解释性方面有显著优势。
摘要由CSDN通过智能技术生成

640


精选 4 篇来自 WSDM 2019、NeurIPS 2018、WWW 2018 和 COLING 2018 的知识图谱相关工作,带你快速了解知识图谱领域最新研究进展。


本期内容选编自微信公众号「开放知识图谱」。


WSDM 2019


640?wx_fmt=png


640?wx_fmt=png


■ 论文解读 | 叶群,浙江大学计算机学院,研究方向为知识图谱、NLP


论文动机

基于 spring-electrical 的模型在网络可视化中取得了非常成功的应用,一个优秀的网络可视化算法意味着越相似的节点在空间中欧式距离越相近。本文将 spring-electrical 模型应用在了链接预测问题上,前提是假设节点之间的欧氏距离和节点之间存在 link 的概率成正相关。性能评估上,模型与 baseline 的对比显示了其性能的优越,尤其是在 node embedding 维度很低的时候。

问题描述

知识图谱由于种种原因,其中很多节点之间存在缺失的边。链接预测算法指的是,给定网络节点和网络结构等信息,去预测尚未存在边的节点之间存在链接的概率。

实验中,给定网络 G=<V,E>,我们随机掩盖一定比例的边(如 10%),并采样一部分负例作为测试集,然后将剩下 90% 的边和所有节点作为训练集。

评估指标采用 AUC 值:

640?wx_fmt=png


Baseline

介绍三种常用的 baseline。

1. Local similarity indices 

分析节点周围的局部结构,作为节点之间存在链接的概率(以下式子中 δ 表示节点的相邻一跳节点)。 

Common neighbours:以两节点公共邻居的个数来衡量存在链接的概率。

640?wx_fmt=png

Adamic-Adar index:common neighbours 的一种加权的改进。

640?wx_fmt=png

Preferential Attachment index:以节点现有的度来衡量节点之间存在链接的概率(非常 naïve 的 assumption)。

640?wx_fmt=png

2. Matrix factorization

矩阵分解的方式将网络的邻接矩阵作为输入,分解成两个低秩的矩阵。低秩矩阵的行或列可以作为节点的 latent feature,将两节点的 latent feature 做点积,即可得到两节点之间存在链接的概率。 

Truncate SVD

640?wx_fmt=png

Non-negative matrix factorization(NMF)

640?wx_fmt=png

3. Neural embedding

一些工作尝试用神经网络来学习 graph embedding,比如经典的 DeepWalk 和 node2vec 算法,都是受 word2vec 的启发。基本思想是将图中的节点当做单词,在图中随机游走得到一系列节点当作一个句子,然后利用 word2vec 的目标函数来做训练。训练完成后,将节点的 embedding 做点积,即得到节点之间存在链接的概率。

模型

Spring-electrical 中的 spring 指的是弹簧,electrical 指的是电荷,其基本思想是将一张图当做一个机械系统,将图中的节点比作电荷,将边比作弹簧。所有的电荷均为同性电荷,相互之间存在斥力;弹簧力表现为引力。

基于这样的假设,当这个力学系统达到平衡之后,不存在边相连的节点将会由于斥力,在空间距离上分布较远。

对库伦定律进行修改,引入超参 p,电荷之间的斥力公式为:

640?wx_fmt=png

对虎克定律进行修改,弹簧的引力公式为:

640?wx_fmt=png


640?wx_fmt=png


通过利用力是能量的负梯度这个性质,可以将一个力学系统转换成能量系统,力的平衡对应系统能量的最小值。所以,目标函数为求解系统能量的极小值,即:


640?wx_fmt=png


上式的求解存在两个问题:1)计算复杂度过大;2)容易收敛到局部极小值。本文采用了一种叫做 ScalableForce Directed Placement(SFDP)的优化方法进行求解,较好地解决了这两个问题。


Case Study

在实际的数据集上进行评估之前,本文先在由球体的三角剖分得到的图上进行了 case study。链接预测的结果如下图所示,可以看到 SFDP 方法取得了很好的效果,同时注意到 SFDP 方法在向量维度极小的情况(d=2,3)下,依旧取得非常好的效果。

640?wx_fmt=png

除此之外,实验将 d=3 的向量进行了可视化(如下图),比较了不同模型可视化的差异。可以看到,SFDP 方法很好的保留了球体的原始形状,SVD 向量分布在 3 条坐标轴上,node2vec 则是一个锥形。

造成这种差异的原因是,SFDP 采用了欧式距离作为损失函数,而 SVD 和 node2vec 则是基于点积。基于欧式距离的损失函数会使不相似的节点在空间上尽可能远,而点积则会使不相似节点尽可能垂直。

640?wx_fmt=png


  • 4
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值