目录
来源
-
解决:发现了很多CNN、RNN无法解决或者效果不好的问题——图结构的数据
具体: -
对CNN:
核心在于kernel,kernel是一个个小窗口,在图片上平移,通过卷积的方式来提取特征。这里的关键在于图片结构上的平移不变性:一个小窗口无论移动到图片的哪一个位置,其内部的结构都是一模一样的,因此CNN可以实现参数共享 -
对RNN:
对象是自然语言这样的序列信息,是一个一维的结构,通过各种门的操作,使得序列前后的信息互相影响,从而很好地捕捉序列的特征。 -
共同点:都属于欧式空间的数据,欧式空间的数据的特点就是结构很规则
-
问题:
现实生活中,有很多不规则的数据结构,典型的就是图结构,或称拓扑结构,如社交网络、化学分子结构、知识图谱等等;
做目标识别的时候,关注的实际上只是二维图片上的部分关键点,这些点组成的也是一个图的结构。
图的结构是十分不规则的,可以认为是无限维的一种数据,所以它没有平移不变性。每一个节点的周围结构可能都是独一无二的,这种结构的数据,就让传统的CNN、RNN瞬间失效
作用
- 跟CNN的作用一样,就是一个特征提取器
- 设计了一种从图数据中提取特征的方法,可以使用这些特征去对图数据进行
- 节点分类(node classification)、图分类(graph classification)、边预测(link prediction),还可以得到图的嵌入表示(graph embedding)
原理
解释
- 图卷积是利用其他结点的信息来推导该结点的信息
- 图中的每个结点无时无刻不因为邻居和更远的点的影响而在改变着自己的状态直到最终的平衡,关系越亲近的邻居影响越大。
- 图数据中的空间特征具有以下特点:
1) 节点特征:每个节点有自己的特征;(体现在点上)
2) 结构特征:图数据中的每个节点具有结构特征,即节点与节点存在一定的联系。(体现在边上)
总地来说,图数据既要考虑节点信息,也要考虑结构信息,图卷积神经网络就可以自动化地既学习节点特征,又能学习节点与节点之间的关联信息。
核心
图卷积的核心思想是利用边的信息对节点信息进行聚合从而生成新的节点表示。
GCN的本质目的就是用来提取拓扑图的空间特征。
两种理解
- 图卷积方法主要有两大流派:基于频谱的方法和基于空间的方法
- 基于频谱的方法主要有Spectral CNN (第一代 GCN)、第二代GCN、ChebyNet、 CayleyNet、一阶 ChebyNet等。在行为识别领域,ChebyNet 及一阶近似被广泛应用。
- 基于空间的方法主要有消息传递与聚合、图采样与聚合、图结构序列化、关注卷积方式、基于注意力机制、关注感知域的方法。
- . GCN方法,其方法主要分为两大类:基于频谱的方法 (spectral-based)和基于空间的方法 (spatial-based)
- 基于频谱的图卷积网络是将图信号与频谱信号进行转换和分析,然后再恢复图信号所在的空域,从而完成图信号的降噪与特征提取。以“降低复杂度”为主线,将常用于图像的卷积神经网络应用到图数据上。
基于频谱的图卷积通过添加自我连接单位矩阵、归一化邻接矩阵 A 的方式解决了基于空间的图卷积忽略节点自身特征、邻接矩阵过于庞大的两个问题
缺点:灵活性不高、普适性不强、运行效率较低
== 基于空间的图卷积方法利用邻域聚合的思想降低了复杂度,增强了泛化能力,提高了运行效率,是行为识别领域在图结构数据上进行分析的基本思想==。
基于谱和基于空间的模型的对比
谱模型是图数据处理的理论基础。基于谱的模型作为针对图数据最早期的卷积网络在很多图相关的分析任务种取得了非常好的效果。通过设计新的图信号滤波器(如Cayleynets),理论上可以建立新的卷积神经网络。然而,由于效率、通用性和灵活性等问题,空间模型比谱模型更受欢迎。
效率
基于谱的方法的计算量会随着图的大小急剧增加,因为模型需要同时计算特征向量[[21]或者同时处理大图,这就使得模型很难对大图进行并行处理或缩放。
基于空间的图方法由于直接对图域的邻