GNN-图神经网络基础内容概述

前言

过去的十多年中,神经网络在图像和文本等结构化数据中已经表现的十分出色。CNN,RNN,自编码器(Autoencoders)等很多流行的模型在以矩阵或向量作为输入的结构形式数据上都能很好地工作,我称这些结构化的数据为表格数据。而这些模型在非结构化数据上的表现怎样呢?比如最近大家在研究中频繁碰到的图结构数据,如果不将这些非结构化的图数据经过复杂的转换变为表格格式的话,使用传统的方法基本无从下手,那么有没有可以向他们有效学习的模型?答案便是GNN——图神经网络(Graph Neural Networks)

图神经网络

Graph Neural Networks其实在2005年就被引入,但是在过去的5年中它们开始流行起来。GNN能够对图中节点之间的关系进行建模,并为其生成数字表示。GNN的重要性不言而喻,因为当前可以用图形表示的现实世界数据太多:社交网络,化合物,地图,运输系统,甚至是在3D点云处理方向。因此,了解GNN背后的基本原理以及它们能够work的原因变得很重要。

先定义一个基本问题:我们想将给定的图映射到单个标签,标签可以是数字值,类或其他任何东西。
如图所示:
在这里插入图片描述
可以理解为基于图数据表示的分类任务,最后只有一个关于图的输出标签,当然可以是文本内容,甚至是另一个图。举个具体的例子:假设每个图都是一个化学化合物或一个分子,而标签对应着该分子可用于生产某种药物的可能性。如果我们有方法从每张图中提取出分子对应的标签,那么我们实际上就可以预测出在某种研发的药物中使用哪些分子更加有效。
上面的图可以表示为 F F F(图)=值,
我们想找到这个函数 F F F,当然下意识想到了神经网络来拟合这个 F F F
在这里插入图片描述

图片出自:Microsoft Research—Graph neural networks: Variations and applications

前向传播过程(Propagation)

我们如何获取这个标签值呢?我们知道可以在图上使用的一种神经网络。考虑到递归神经网络RNN可以对特殊类型的图进行操作——链状图(基本上是一条线)。时间序列实际上是链状图,其中每个时间戳都是一个节点,后面跟着下一个时间戳。
因此,我们可以构建一个网络,其中每个图节点都是一个循环单元(LSTM或变形的网络),且该节点表示的信息是通过该链传递消息的一种Embedding。而且由于单元都是循环的,因此当这种Embedding的消息在图形中移动时,信息是不会丢失的。这是我们熟悉的递归神经网络。与语言翻译和其他自然语言处理应用程序中使用的完全相同
我们可以将这个想法扩展到适当的图上,然后得到:
1).GNN基本表示:
在这里插入图片描述
2). GNN的前向传播:
在这里插入图片描述
3). 消息嵌入汇总:
在这里插入图片描述

图片摘自Microsoft Research关于GNN 的演讲幻灯片 GNN汇总视频B站链接

图例说明: 每个橙色三角形表示曾经是图形节点,现在已由循环单元替换。信封表示将要遍历图形节点的消息嵌入。每个图的边被神经网络取代,用来获取边上的信息特征(其权重)。
现在是学习部分。在当前步下,每个节点从其所有邻居中提取消息嵌入,并计算其总和(为啥是求和?因为求和操作最简单,且丢失信息最少),并将其连同收到的消息嵌入一起传递给循环单元,这将产生新的嵌入结果。这个新的嵌入包含所在节点的信息以及所有邻居的信息。在下一步,它还将包含其二阶邻居的信息,以此类推。该过程一直进行到每个节点都知道图中的所有其他节点为止。现在,每个嵌入都具有来自所有其他节点的信息。最后一步是收集所有嵌入累加(图上的圆圈部分),这将为我们提供整个图形的单个嵌入结果。
我们已经在单个嵌入中获取到了整个图的消息。现在可以在其他一些模型帮助下使用获得的图消息嵌入来执行一些分类,预测和聚类。
有几个推荐不错的GNN库推荐:

最近会持续收集和分享GNN方向上的相关研究:包括演讲视频,论文,幻灯片等,欢迎关注!
GNN汇总视频B站链接

人工智能(AI)最近经历了复兴,在视觉,语言,控制和决策等关键领域取得了重大进展。 部分原因在于廉价数据和廉价计算资源,这些资源符合深度学习的自然优势。 然而,在不同的压力下发展的人类智能的许多定义特征仍然是当前方法无法实现的。 特别是,超越一个人的经验 - 从婴儿期开始人类智能的标志 - 仍然是现代人工智能的一项艰巨挑战。 以下是部分立场文件,部分审查和部分统一。我们认为组合概括必须是AI实现类似人类能力的首要任务,结构化表示和计算是实现这一目标的关键。就像生物学利用自然和培养合作一样,我们拒绝“手工工程”和“端到端”学习之间的错误选择,而是倡导一种从其互补优势中获益的方法。我们探索如何在深度学习架构中使用关系归纳偏差来促进对实体,关系和组成它们的规则的学习。我们为AI工具包提供了一个新的构建模块,具有强大的关系归纳偏差 - 形网络 - 它概括和扩展了在形上运行的神经网络的各种方法,并为操纵结构化知识和生成结构化行为提供了直接的界面。我们讨论网络如何支持关系推理和组合泛化,为更复杂,可解释和灵活的推理模式奠定基础。作为本文的配套文件,我们还发布了一个用于构建形网络的开源软件库,并演示了如何在实践中使用它们。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值
>