MoNet(2017-CVPR)空间方法
摘要
到目前为止,大多数深度学习研究都集中在处理一维、二维或三维欧几里德结构的数据,如声音信号、图像或视频。近年来,几何深度学习越来越受到人们的关注,试图将深度学习方法推广到非欧几里德结构的数据,如图和流形,在网络分析、计算社会科学或计算机图形学等领域有着广泛的应用。在本文中,我们提出了一个统一的框架,允许将CNN架构推广到非欧几里德域(图和流形),并学习局部、平稳和组合任务特定的特征。
主要贡献
- 提出了混合模型网络(MoNet),一个允许在非欧几里德域(如图和流形)上设计卷积深体系结构的通用框架。
- 方法遵循空间域方法的一般原理,将类似卷积的操作作为模板匹配,与图或流形上的局部内在“面片”匹配。关键的新颖之处在于提取面片的方式:以前的方法使用固定的面片,例如在测地坐标系或扩散坐标系中,我们使用参数化构造。
图的深度学习
拉普拉斯矩阵:
D是图的度矩阵,W是图的邻接矩阵。
拉普拉斯算子特征分解:
对于依稀信号f,傅里叶转换为:
那么给定两个信号f,g(卷积核),谱卷积定义为:
改进:切比雪夫多项式基的显式展开来表示谱滤波器
切比雪夫多项式定义:
方法
- 定义多个内核函数(是否已参数化)以测量目标节点与其他节点之间的相似性
- 卷积核是这些核函数的权重
根据上下文,我们用x表示流形上的一个点或一个图的顶点,并考虑x的邻域中的点y∈N
x
_x
x。对于每个这样的y,我们将伪坐标u(x,y)的d维向量相关联。在这些坐标系中,我们定义了一个加权函数(核)
由一些可学习的参数Θ参数化。因此,patch操作符可以用以下通用形式编写
所以空间推广为:
我们构造的两个关键选择是伪坐标u和权函数w(u)。
本文W(u)选择为: