论文笔记整理:毕祯,浙江大学硕士,研究方向:知识图谱、自然语言处理。
链接:https://arxiv.org/abs/2006.07060
动机
图已被用作对人或物体之间的成对关系建模的强大工具。而超图是更广泛概念的一种特殊类型,其中每个超边可以由任意数量的节点组成,而不是仅由两个组成。大量的现实世界数据集都是这种形式的。比如电子邮件的收件人列表,参与讨论主题的用户或在线问题中标记的主题标签等。由于这些情况表示形式复杂且缺少适当的工具,因此在研究中很少会去关注探索这些问题的建模与算法。
本篇论文根据经验研究了多个跨领域的真实世界超图数据集。为了进行深入研究,引入了多级分解方法,该方法通过一组成对图表示每个超图。每个成对图(称为k级分解图)捕获了k个节点的子集对之间的交互。通过经验的总结,在每个分解级别,所研究的超图都遵循五个结构特性或者指标。这些属性用作评估超图的逼真度的标准,并为超图生成问题奠定基础。文章最后提出了一种超图生成器,采取了非常简单的思路,但是能够满足这些评估指标。与此相比的是其他对比模型则很难达到同样的效果。
背景
图1 超图的例子
超图是图的一般化,其中边可以连接任意数量的顶点。相反在普通图中,一条边正好连接两个顶点。在图1中,假设顶点代表文章,每条边代表两个顶点享有同一个作者。如果使用简单的图结构来表示,就会丢失“同一作者发表多篇文章”这样集合的信息。实际生活中存在着大量类似的图结构,而超图是相对合适的表示方法。
多级分解方法
定义: