论文浅尝 - KDD2020 | 真实世界超图的结构模式和生成模型

论文笔记整理:毕祯,浙江大学硕士,研究方向:知识图谱、自然语言处理。



链接:https://arxiv.org/abs/2006.07060


动机

图已被用作对人或物体之间的成对关系建模的强大工具。而超图是更广泛概念的一种特殊类型,其中每个超边可以由任意数量的节点组成,而不是仅由两个组成。大量的现实世界数据集都是这种形式的。比如电子邮件的收件人列表,参与讨论主题的用户或在线问题中标记的主题标签等。由于这些情况表示形式复杂且缺少适当的工具,因此在研究中很少会去关注探索这些问题的建模与算法。

本篇论文根据经验研究了多个跨领域的真实世界超图数据集。为了进行深入研究,引入了多级分解方法,该方法通过一组成对图表示每个超图。每个成对图(称为k级分解图)捕获了k个节点的子集对之间的交互。通过经验的总结,在每个分解级别,所研究的超图都遵循五个结构特性或者指标。这些属性用作评估超图的逼真度的标准,并为超图生成问题奠定基础。文章最后提出了一种超图生成器,采取了非常简单的思路,但是能够满足这些评估指标。与此相比的是其他对比模型则很难达到同样的效果。

背景

图1 超图的例子

超图是图的一般化,其中边可以连接任意数量的顶点。相反在普通图中,一条边正好连接两个顶点。在图1中,假设顶点代表文章,每条边代表两个顶点享有同一个作者。如果使用简单的图结构来表示,就会丢失“同一作者发表多篇文章”这样集合的信息。实际生活中存在着大量类似的图结构,而超图是相对合适的表示方法。

多级分解方法

定义:

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值